Changeset 3254 in Sophya for trunk/SophyaLib/Manual


Ignore:
Timestamp:
May 23, 2007, 3:42:24 PM (18 years ago)
Author:
ansari
Message:

Autres mesures performances, apres correction ds zthr.cc (passage * (mtxmul) a + (array-add)) , Reza 23/05/2007

File:
1 edited

Legend:

Unmodified
Added
Removed
  • trunk/SophyaLib/Manual/perfmachine.txt

    r3251 r3254  
    9191(j)xeon-osx           
    9292
    93 (p)ibm-aix-regatta    
     93(p)ibm-aix-regatta   | 3100   |  130      55      133    |    730       115      1750
    9494(p)ibm-aix-meso      | 3600   |  150      75      150    |   1480       203      3600
    9595----------------------------------------------------------------------------------------------
     
    160160--------------------------------------------------------
    161161
    162 B.1/ arr = c1*a1+c2*a2   ( ~ 3 10^6 op. double)
     162B.1/ Version corrige de zthr.cc (apres 23/05/07)
     163         arr = (c1*a1) + (c2*a2)
     164         ~ 3 x 4. 10^6 operations int_4 sur 3 x 4 10^6 int_4   
     165         12 M.Ops int_4 / ~ 50 MO
     166
     167(1) time cpupower 0     # compile avec -O  (/ -O -g)
     168(2) time zthr arr 1 2000   1 thread
     169(3) time zthr arr 2 2000   2 thread
     170(4) time zthr arr 4 2000   4 thread
     171(5) time zthr arr 6 2000   6 thread
     172(6) time zthr arr 8 2000   8 thread
     173
     174-----------------------------------------------------------------------------------
     175                     (1)MFLOPS  (2)CPU/Elap/%   (3)CPU/Elap/%   (4)CPU/Elap/%
     176-----------------------------------------------------------------------------------
     177(a)xeon-lx-2.4GHz      53        0.5/1/43%      1/1.1/88%      2.8/1/262%
     178                                    (5) 4.5/1.8/246%      (6) 6.1/2.1/310%
     179                                 
     180       
     181(b)xeon-lx-2.8GHz      65       
     182                                 
     183(c)amd-lx              95        0.23/1/22%     0.44/1/51%       1/1/102%     [-O -g]
     184                                     (5) 1.6/1/106%   (6) 2.2/1.2/100%
     185
     186
     187(d)osf-asc                     
     188                                 
     189(e')osf-cool           32        0.43/1.2/35%   0.6/1.33/44%     1.1/1.3/82%      [-O -g]
     190                                     (5) 1.45/1.7/85%   (6) 1.83/2.16/84%         
     191(f)superosf                   
     192
     193(g)G5-osx-1GHz         88       1.5/1.5/100%    3.2/1.7/185%      6.6/3.5/188%    [-O -g]
     194(g)G5-osx-1GHz         88       0.4/1/40%       0.9/1.0/90%       2/1.2/169%      [-tune=G5 -g]
     195                                     (5) 3.3/2/164%    (6) 4.3/2.6/165%
     196(h)G4-osx-1.25GHz      25       3/3/95%                                           [-O2 -g]
     197                                 
     198(i)core-osx-1.83GHz               [-O2 -g]
     199
     200(j)xeon-osx           
     201
     202
     203(p)ibm-aix-regatta   130       
     204
     205(q)ibm-aix-meso      150        0.6/1/58%       1/1/91%           1.7/1.2/132%    [-O3]
     206                                     (5) 2.4/1.2/193%   (6) 4.25/1.6/265%     
     207
     208
     209(s)sgi-magique         460       
     210 -----------------------------------------------------------------------------------
     211
     212B.1.bis/ ancienne version de zthr (avant 23/05/07)
     213         On faisait 2 multiplications par ctye suivi d'un produit matriciel !
     214         arr = c1*a1*c2*a2   ( ~ 3 10^6 op. double)
    163215(1) time cpupower 2     # compile avec -O3  (/ -O -g)
    164216(2) time zthr arr 1 1000   1 thread
     
    291343 -----------------------------------------------------------------------------------
    292344
     345
     346B.4/ Operations sur tableaux doubles- mesures avec spar
     347  csh> time spar 2 1 2000 2000
     348  (1) cpupower 2  MFLOPS
     349  (2) MFLOPS (double) spar
     350  (3) time spar 2 5 1000 2000 CPU/Elap/%
     351-----------------------------------------------------------------------------------
     352                     (1)MFLOPS      (2)CPU / %         (3)CPU/Elap/%
     353-----------------------------------------------------------------------------------
     354(a)xeon-lx-2.4GHz      53       ~ 20-35 MFLOPS , 90%     20/20.2/99%       [-g -O]
     355                                 
     356       
     357(b)xeon-lx-2.8GHz      65       
     358                                 
     359(c)amd-lx              95       ~ 20-40 MFLOPS , 99%     17.2/17.2/100%    [-g -O]
     360
     361
     362(d)osf-asc                     
     363                                 
     364(e)osf-xp1000          32       ~ 15-25 MFLOPS , 90%     37.6/41.2/91%      [-g -O] 
     365(f)superosf                   
     366
     367(g)G5-osx-1GHz         88       ~ 10-25 MFLOPS , 99%     45/45/100%         [-g -O] ou [-g -O2]
     368(h)G4-osx-1.25GHz      25       ~ 8-16  MFLOPS , 92%     45.5/52/90%        [-g -O2]
     369                                 
     370(i)core-osx-1.83GHz             
     371
     372(j)xeon-osx           
     373
     374
     375(p)ibm-aix-regatta   130       
     376
     377(q)ibm-aix-meso      150        ~ 80-100 MFLOPS , 90%   5./23/22%     [-O3]   
     378
     379
     380
     381(s)sgi-magique         460       
     382 -----------------------------------------------------------------------------------
     383
     384
    293385C/ Calcul fft (FFTW , FFTPack )
    294386-------------------------------
Note: See TracChangeset for help on using the changeset viewer.