Changeset 3187 in Sophya for trunk/SophyaLib/Manual


Ignore:
Timestamp:
Feb 20, 2007, 6:14:13 PM (19 years ago)
Author:
ansari
Message:

Ajout mesures avec zthr sync - Reza 20/02/2007

File:
1 edited

Legend:

Unmodified
Added
Removed
  • trunk/SophyaLib/Manual/perfmachine.txt

    r3179 r3187  
    88(b) ccali : Bipro-bicoeur Xeon@2.8 GHz Linux (xeon-lx-2.8GHz)  , icc 8.0 ou 9.0
    99(c) sgsda: AMD Bipro AMD opteron 248 @ 2.2 GHz (amd-lx-
     10(cc) grid-saclay A: MD opteron 275 Bipro-bicoeur  @ 2.2 GHz (amd275-lx)
    1011
    1112(d) asc: bipro alpha (@ ~1 GHz) server DS20 OSF (osf1)  , cxx 6.5 (osf-asc)
     
    1920(j) MacPro-Grosdidier : Apple / Xeon 2 double-coeur @ 3 GHz gcc 4.0.1 , compil SOPHYA -O2 -g
    2021
    21 (p) IBM-AIX regatta , xlC ,
     22(p) IBM-AIX regatta , xlC , IBM eServer pSeries 655 , 8 proc power4 @ 1.1 GHz
    2223
    2324
     
    2728La machine MacPro avec OSX se debrouille quand meme mieux.
    2829- Effet du systeme ou carte mere ???
     30
     31
     32Donnees SPECint2000 (3) / SPECfp2000 (2) (http//www.spec.org)
     33(1) MFLOPS  -> cpupower 2
     34----------------------------------------------------------------------
     35                         MFLOPS(1)      SPECfp      SPECint
     36----------------------------------------------------------------------
     37(b)xeon-lx-2.8GHz         900            1400        1400
     38(c)amd-lx                 690            1600        1300
     39(cc)amd2-lx               675            1600        1300
     40
     41(d)osf-xp1000             648             500         400
     42(e)superosf               842            1100         700
     43
     44(i)core-osx-1.83GHz       855            1400        1500
     45(j)xeon-osx              2600            2900          -
     46
     47(p)ibm-aix                700            1050         700
     48----------------------------------------------------------------------
     49
    2950
    3051A/ Compilation tout SOPHYA
     
    6788(i) 83 MO
    6889
    69 B/ Calcul brut avec / sans threads
    70 -----------------------------------
     90B/ Calcul brut (Tableaux de SOPHYA) avec / sans threads
     91--------------------------------------------------------
    7192
    7293B.1/ arr = c1*a1+c2*a2
     
    89110                                           (4)13.5/7/193%
    90111                                           (5)20.3/10.23/198%
     112(cc)amd2-lx            675        2/2/99%                   4.15/2.1/197%
     113                                           (4)8.25/4.15/198%
     114                                           (5)13.6/4.6/292%
     115                                           (6)19.8/6.5/300%
    91116
    92117(d)osf-xp1000          648        5.1/5.3/96.6%            11.4/11.4/99%       
     
    141166                                           (5) 41.4/21.07/196%
    142167                                           (6) 55.4/27.9/198.7% 
     168(cc)amd2-lx            675        4.1/4.1/100%               9.55/4.8/198%
     169                                           (4) 20/10.27/195%
     170                                           (5) 32.8/11.16/294%
     171                                           (6) 42.75/13.8/309%
     172
    143173
    144174(d)osf-xp1000          648        13/14.1/92%                27.1/27.4/99%
     
    176206 -----------------------------------------------------------------------------------
    177207
    178 B.3/ Tests fft (FFTW , FFTPack )
     208C/ Calcul fft (FFTW , FFTPack )
     209-------------------------------
    179210
    180211(1) time cpupower 2
     
    193224(c)amd-lx              690                                       4.2/4.2/100%     238
    194225                                                            ~2x  4.7/4.7/99%
     226(cc)amd2-lx            675        2.8/2.8/99%                    3.56/3.58/99%
    195227
    196228(d)osf-xp1000          648        9.9/10.2/97%       101        9.3/9.46/98.5%    107     
     
    212244(q)sgi-magique         460        22/22/98%           42         24.5/25/99%       40           
    213245 -----------------------------------------------------------------------------------
     246
     247
     248D/ Efficacite de gestion de lock (mutex) avec les threads
     249-----------------------------------------------------------
     250(32 threads - operant sur 2000 vecteurs ~ 64000 lock/unlock/wait/broadcast)
     251
     252csh> time zthr syncp 32 2000 4
     253(1) time cpupower 2
     254
     255----------------------------------------------------------------------
     256                        (1)MFLOPS   CPU(s)  IndPerf   TCPU/Elapsed %
     257----------------------------------------------------------------------
     258(a)xeon-lx-2.4GHz        1167       17.8                   178%
     259      avec -O3 -g
     260(b)xeon-lx-2.8GHz (2)     
     261(c)amd-lx                 690       0.4                     31%
     262
     263(d)osf-xp1000 (1)       
     264(e)superosf (1)         
     265(f)osf-asc (1)           420        5.4                    100%
     266
     267(f)G4-osx-1.25GHz (1)    333        64                      96%
     268(h)G5-osx-1GHz (2)      1150        2.6                    130%                   
     269    -tune=G5           
     270(i)core-osx-1.83GHz
     271              -O2   
     272(j)xeon-osx             2600        2.55                   143%
     273
     274(p)ibm-aix               700        4.7                    111%
     275----------------------------------------------------------------------
Note: See TracChangeset for help on using the changeset viewer.