2 processeurs virtuels sur P4 3.0GHz - Hardware - Linux et OS Alternatifs
Marsh Posté le 16-09-2008 à 11:35:17
HT vs multicore ? c'est normal alors
Marsh Posté le 16-09-2008 à 11:43:08
ReplyMarsh Posté le 16-09-2008 à 11:49:39
la durée de traitement dépend énormément des extension disponibles.
la durée de traitement dépend des bus de mémoire cache.
la durée de traitement dépend du type de calcul demandé, certains ne sont pas foncièrement parallèlisants.
voir HyperThreading ou multicore
Marsh Posté le 16-09-2008 à 11:55:39
mpe a écrit : non je n ai aucun dualcore |
tu as regardé les specs des procs ? j'ai supposé que tout le reste y compris la RAM avait les mêmes perfs hein. Y'a autant de RAM sur tous ?
Marsh Posté le 16-09-2008 à 12:15:39
black_lord a écrit : |
non sur mes 4 P4 3,2GHZ j ai 2GB de ram par PC
pour les autres, ils sont tous a 1 GB
mais j pense pas que ce soit lie, j m explique
le premier test etait de prendre 2 P4 3,2GHz a 2 GB de ram chacun, de faire tourner le calcul en "spawnant" 2 CPU
puis de comparer avec la meme demarche, sauf que je "spawne" 4 CPU (en gros j considere que chaque machine est un bi-proc)
j obtiens un gain de tps proche du x2
...
si j fais exactement le meme topo avec 2 P4 3,0GHZ avec 1 GB de ram chacun, la c est bcp moins performant: le fait de mettre 4 CPU ne me permet pas de faire tourner mon calcul quasiment 2x plus vite.
Je vous mets ce que j obitens avec cat /proc/cpuinfo sur les 2 PC
fluent@master:~> cat /proc/cpuinfo
processor : 0
vendor_id : GenuineIntel
cpu family : 15
model : 4
model name : Intel(R) Pentium(R) 4 CPU 3.20GHz
stepping : 1
cpu MHz : 3193.326
cache size : 1024 KB
physical id : 0
siblings : 2
fdiv_bug : no
hlt_bug : no
f00f_bug : no
coma_bug : no
fpu : yes
fpu_exception : yes
cpuid level : 5
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe pni monitor ds_cpl cid
bogomips : 6291.45
processor : 1
vendor_id : GenuineIntel
cpu family : 15
model : 4
model name : Intel(R) Pentium(R) 4 CPU 3.20GHz
stepping : 1
cpu MHz : 3193.326
cache size : 1024 KB
physical id : 0
siblings : 2
fdiv_bug : no
hlt_bug : no
f00f_bug : no
coma_bug : no
fpu : yes
fpu_exception : yes
cpuid level : 5
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe pni monitor ds_cpl cid
bogomips : 6373.37
fluent@master:~> rsh node4
Last login: Mon Sep 15 22:34:00 from master.site
fluent@node4:~> cat /proc/cpuinfo
processor : 0
vendor_id : GenuineIntel
cpu family : 15
model : 4
model name : Intel(R) Pentium(R) 4 CPU 3.00GHz
stepping : 1
cpu MHz : 2995.739
cache size : 1024 KB
physical id : 0
siblings : 2
fdiv_bug : no
hlt_bug : no
f00f_bug : no
coma_bug : no
fpu : yes
fpu_exception : yes
cpuid level : 5
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe pni monitor ds_cpl cid
bogomips : 5914.62
processor : 1
vendor_id : GenuineIntel
cpu family : 15
model : 4
model name : Intel(R) Pentium(R) 4 CPU 3.00GHz
stepping : 1
cpu MHz : 2995.739
cache size : 1024 KB
physical id : 0
siblings : 2
fdiv_bug : no
hlt_bug : no
f00f_bug : no
coma_bug : no
fpu : yes
fpu_exception : yes
cpuid level : 5
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe pni monitor ds_cpl cid
bogomips : 5980.16
Marsh Posté le 16-09-2008 à 14:58:32
Tes machines ont chacunu combien de barette de RAM ? Le bicanal apporte tres peu en general... mais peut etre que ton application en profite plus largement ?
Quel type de calcul est-ce ? Je veut dire, tres intensif au niveau des acces memoire, gros debit global ? Ou seulement CPU, avec de faibles deplacement de donnees ?
Marsh Posté le 16-09-2008 à 15:06:13
c est du calcul CFD avec fluent
pour les barettes de RAM, la j sais plus exactement, etant donne que j recupere des PC que mon departement IT n a plus besoin, et j les incorpore ds mon cluster, apres avoir mis linux, un peu de memoire RAM (jusk a 1GB) et la configuration pour le message passing
Marsh Posté le 16-09-2008 à 11:29:29
hello,
j ai une question
sur mon cluster de 15 pc (essentiellement des p4 allant de 3,2 a 2,0GHz sous Suse Linux Enterprise Server 9 - 32bits), j commence a avoir de bonnes performances comparables voir superieures a des serveur HPC genre poweredge6950 ou proliantDL380R05
comparatifs faits sur un modele d un pote qui a un nouveau server 2 CPU quadcore proliantDL380R0 au taquet
enfin bref...
sur mes 4 plus gros PC (HP dc7100), des p4 3,2GHz avec 2 GB de ram, j arrive a mettre 2 process par CPU, ce qui me permet de faire tourner un calcul sur 8 "coeurs" au lieu de 4 CPU
le tps de calcul est divise quasiment par 2
sur des P4 3,0GHz (HP dx6100), qd j veux faire la meme chose, le rendement n est pas du tout le meme (ça va pas 2 fois plus vite)
qd j regarde ce que me donne un >cat /proc/cpuinfo, j obtiens bien 2 processeurs virtuels (processeur 0 et processeur 1)
qd j fais la meme manip sur des vieux P4 2.0GHz, la j obtiens qu un seul processeur, donc la je sais que c est pas la peine de mettre 2 process sur le CPU.
est-ce que je peux esperer mettre 2 process par CPU sur mes dx6100, ou est-ce que j n obtiendrai rien de mieux