NForce2 : influence du "Row-active delay" (=tRAS) sur les perfs! - Carte mère - Hardware
Marsh Posté le 11-06-2003 à 10:20:48
Score mémoire de PCMark2002 :
On obtient ici une jolie courbe en cloche. Le maximum est atteint avec 10, 11, 12 et 13.
On remarque la même baisse de performance lorsque le tRAS est >= 13 qu?avec MBench.
Temps de calcul de 50M à PiFast 4.2 (less is better) :
Encore une belle courbe! Elle est similaire à celle de PCMark2002 sauf que l?allure est différente à cause du less is better.
Qu?en conclure ?
Les différents logiciels testés (Sandra2003, MBench, PCMark2002 et PiFast) semblent aller dans le même sens !
1) avec un tRAS < 10, les perfs sont les moins bonnes.
2) avec une valeur de 13, 14 ou 15, les résultats semblent s'effondrer.
3) il apparaît que les meilleurs valeurs sont 10, 11 et 12.
J'avoue avoir une préférence : tRAS = 11
Nous voyons donc, que le NForce2 s?exprime le mieux avec un tRAS à 11. C?est contre toute logique ! C?est pourquoi j?ai ajouté quelques tests. En effet, le Nforce2 utilise le DASP (cache intelligent) en fonctionnement Dual-DDR. C?est pourquoi j?ai voulu mesurer le comportement en Single-DDR cette fois-ci.
J'ai donc repris quelques résultats de Sandra2003 avec 4 valeur du tRAS : 5, 7, 9 et 11 (ça me semble bien comme choix). Et pour chaque valeur j'ai lancé le bench avec le CPU Interface sur "Enabled" puis sur "Disabled". J'ai testé également en Single-DDR (512Mo sur Dimm1&2) et Dual-DDR (512Mo sur Dimm2&3). On verra ainsi l'influence de ces 3 paramètres (tRAS, CPU interface et dual/single) dans tous les cas possibles!
Résultats obtenus à Sandra 2003 (bench mémoire):
Qu?en conclure ?
1) le CPU Interface n'a aucun influence sur les performance mémoires (en Single ou en Dual)
2) en Single-DDR, le tRAS influe très peu sur les performances
3) en Dual-DDR, les perfs augmentent lorsque le tRAS augmente
4) en Dual-DDR et avec un tRAS faible, les perf sont proches voire inférieures au Single-DDR!
Le phénomène ne semble donc se produire qu?en Dual-DDR. Dans ce mode le tRAS à 11 semble être apprécié. Ce qui est surprenant, c?est le point 4) ! Mais cela reste à confirmer sur d?autres logiciels.
CONCLUSION
Sur le Nforce2(Ultra) fonctionnant en Dual-DDR, l?augmentation du tRAS entraîne une augmentation des performances. Les meilleur valeurs semblent être 10, 11 et 12. Cependant ce phénomène disparaît lors d?un fonctionnement Single-DDR.
Cela semble indiquer que le comportement étrange du Nforce soit dû au DASP qui n?est activé qu?en mode Dual-DDR.
Voici ce qu?est le DASP du Nforce 2 :
Mais le principal intérêt de ces puces se situe plus au niveau de leur contrôleur mémoire très performant. Performant en terme de temps de latence tout d´abord, via le DASP, un cache qui profite de la bande passante mémoire inutilisée pour charger des données qui devraient être requises plus tard par le processeur.
Voici des explications de quelques forumeurs :
bap2703 a écrit : a écrit : La seule explication que je verrais ca serait en pagination. Pendant X secondes avec une grosse valeur on fait moins d'accès qu'avec une petite valeur. Donc comme on fait moins d'accès on évites la latence d'activation de la ligne. Mais si on lit des données à chaque fois sur des lignes différentes là normalement y a perte de performance. |
Marc a écrit : a écrit : P-e un problème de synchronisme sur le nForce2, mais c'est chelou koi |
fouge a écrit : a écrit : Le NForce2, lorsqu'il est en DUAL-DDR utilise, grâce à la BP inutilisée, un cache "intelligent". Lorsque le tRAS est trop grand, le NForce2 est obligé de regarder + souvent ce qu'il y a dans la cache ce qui a pour effet d'augmenter les perfs! |
N?hésitez pas à nous faire part de vos théories les plus folles!
Mais finalement, quel valeur du tRAS doit-on choisir ? Voici un petit récapitulatif :
Les raisons en faveur d?un tRAS à 10, 11 ou 12 :
1) c'est au moins aussi stables que les valeurs inférieures
2) c'est plus performant sous les benchs mémoire et sous PiFast (les recordman apprécieront)
3) l?augmentation du tRAS (5 à 11 par ex) permet peut-être de monter en FSB
4) l?augmentation du tRAS (5 à 11 par ex) permet peut-être de baisser un peu les autres timing
Les raisons en faveur d?un tRAS à 4, 5 ou 6 :
1) théoriquement c'est plus performant
2) psychologiquement c'est dur d'augmenter un timing mémoire
3) essayer de se rapprocher de l'instabilité
4) ne pas battre les records de Sandra2003 et PiFast
5) monter moins haut en FSB
La valeur du tras doit respecter la formule suivante :
tRAS >= tRCD + CAS + 2
source: http://www.mushkin.com/mushkin/pop-up/latencies.htm
Toutes les valeurs du tRAS inférieures à tRCD + CAS + 2 cycles vont autoriser le contrôleur mémoire à fermer la page mémoire inopinément et cela causera une baisse de performance en raison d'un transfert tronqué qui doit être répété. De plus il y a le risque de corruption des données. Ce n'est pas vraiment un problème tant que le système continue de fonctionner mais au cas où il serait arrêté et le contenu de la mémoire écrit sur le disque dur, les conséquences peuvent être catastrophiques. Pour le disque dur en tous cas.
ANNEXES
Downloader les benchmark utilisés :
Sandra2004 SP1 : http://visionpc.online.fr/images/s [...] 32-BHF.exe
MBench 1.0 : http://www.x86-secret.com/Download/mbench.zip
PCMark2002 : ftp://ftp.edome.net/apuohjelmat/b [...] rk2002.exe
PiFast 4.3 : http://numbers.computation.free.fr [...] pifast.zip
Article interessant sur sur l'influence des timings (entre autre) :
http://www.hardware.fr/articles/427/page1.html
Voici la documentation officielle (en Français) de NVidia concernant l'architecture mémoire du NForce2 :
http://olivier.fouge.free.fr/Timin [...] NAL_fr.rar (155ko au format RAR)
http://www.nvidia.fr/docs/lo/2606/ [...] NAL_fr.pdf (255ko au format PDF)
Comparatif des barettes de RAM PC3200/3500/3700 :
http://www.hardware.fr/articles/470/page1.html
Influence des timing, OC, SAV et performances. C?est très complet !
On peut voir en page 5 du comparatif :
Marc a écrit : a écrit : Première constatation, et c´est le premier chipset qui offre un tel résultat, chez NVIDIA un RAS Active Time plus bas n´est pas forcément significatif de meilleures performances. Certes, aucun n´impact n´est mesuré dans un test plus applicatif, mais la différence est tout de même notable. |
Un article de TomsHardware : How to Speed up Your RAM
http://www.tomshardware.com/howto/20030701/index.html
Article qui étudie l'influence des timings (sauf le tRAS) et de la quantité de RAM sur les performances.
Fin du topic
Marsh Posté le 11-06-2003 à 10:28:03
3dmark2001 est assez sensible à la bande passante
Marsh Posté le 11-06-2003 à 10:52:03
En fait je cherche des bench mémoire ainsi que des logiciels dépendants de la BP mémoire.
Je referrai un p'tit comparo en 4/2/2/2, 6/2/2/2 et 12/2/2/2
J'y inclurai donc :
1) 3DMark2001 : quelles scènes? J'en met 2 ou 3, pas plus!
2) Quake3 : quels paramètres?
resolution : 640, 800 ou 1024
couleur : 16 ou 32bit
eclairage : lightmap ou vertex
geométrie : mini ou maxi
Bref que choisir pour que ça dépende le moins possible du CPU et de la CG mais que ça soit très dépendant de la BP mémoire?
Marsh Posté le 11-06-2003 à 12:29:38
Et ya rien qui pompe sue la BP mémoire?
Sinon pour les bench mémoire "pure" ya :
MemTest 3.0
SafBench 2.31
PCMark2002
MemTach 0.93
StreamD (j'ai pas trouvé d'URL )
Marsh Posté le 11-06-2003 à 13:53:15
fouge a écrit : Et ya rien qui pompe sue la BP mémoire? |
Tests mem : rajoute AIDA 32 d'autant que tu verras il est moins frustrant que 3D Mark 2003 !
Pour ROW, j'ai lu avec intérêt et ma NF7-S (v 1.2) ton étude ... sérieuse. Je n'en sais guère > toi j'ai à peu près les m^ réglages sauf que le cas latency à 2 m'est interdit !
row = face ; nos barrettes sont des double-faces c'est dans les benchs que je l'ai compris.
J'avais posé la question sans jamais de réponse
comment fais-tu pour avoir un screenshot dans le BIOS ? Ou bien as-tu fait une photo ?
merci
Marsh Posté le 11-06-2003 à 14:00:49
OK pour AIDA32.
Ya aussi MBench...
Parmi tous ces tests, je ferai une sélection.
Je vais perdre trop de temps à tous les faire.
Je veux juste vérifier que le résultat ne se produit pas que sous Sandra2003!
Pour la photo du bios, c'est hardcop qui l'a faite avec un APN. Ya pas de miracle!
Concernant cette histoire ne nb de faces, ben... les miennes sont des simples faces. J'ai 2 barette de 256Mo simple face configuées en Dual-DDR (DIMM2&3).
Marsh Posté le 11-06-2003 à 14:15:20
bizarre ton constat
'vais voir si je fais la même observation un de ces jours.
Marsh Posté le 11-06-2003 à 15:12:20
J'observe la même chose avec mes ch-5, j'ai mis le tRAS à 9 et je gagne une trentaine mb/s avec Sandra et qques fps de + en 3d
Par contre je suis obligé de mettre le tRCD à 3 sous peine d'erreurs à memtest, m^m à 3v.
216@4-3-2-2.0 = 3282/3065
216@9-3-2-2.0 = 3310/3090
Marsh Posté le 11-06-2003 à 15:49:53
Je vais contacter _Storm_ vu que c'est lui qui a découvert ce phénomène!
Dès demain, je publirai un tableau 4/2/2/2 VS 6/2/2/2 VS 12/2/2/2
Yaura des bench mémoire, Quake3 et 3DMark2001.
C'est quoi le tRCD? Le RAS-to-CAS delay? (cf bios Abit)
Chez moi c'est stable en X/2/2/2 à 2.7V.
Mais j'ai pas testé sous memtest. Je ferai ça ce soir!
Vroom> Ta CH-5, c'est koi? Twinmos, A-DATA,...?
Marsh Posté le 11-06-2003 à 16:06:34
C'est de la TwinMos, 2x256mb dual
Le tRCD est le 2ème timing dans le bios,
je vais faire un memtest à 2.72v réel maintnt que j'ai mis 9, c moins sensible et pourtant plus perfs...
ceci dit je reste callé à 216fsb dual comme single et je sais que c pas la ram
Marsh Posté le 11-06-2003 à 16:36:52
Ben moi je sais pas trop en fait
1) 223MHz c'est le maximum "Sandra2003 stable"
2) 219MHz c'est le maximum "3DMArk2001 stable"
Je connais pas encore le maxi "stable à long terme"
edit: en Turbo, 2.9V
Vroom> Mets le tRAS à 12 C'est plus stable et plus performant!
Marsh Posté le 11-06-2003 à 18:17:58
Personne pour me conseiller 1 ou 2 logiciels plus "concrets" que Sandra 2003?
Toute façon je posterai un new tableau demain!
Et apparemment on est trois à avoir ce résultat : _Storm_, Vroom et moi.
Ca se confirme donc : 12/2/2/2 + performant que 5/2/2/2
Marsh Posté le 11-06-2003 à 19:22:35
La seule explication que je verrais ca serait en pagination.
Pendant X secondes avec une grosse valeur on fait moins d'accès qu'avec une petite valeur.
Donc comme on fait moins d'accès on évites la latence d'activation de la ligne.
Mais si on lit des données à chaque fois sur des lignes différentes là normalement y a perte de performance.
Si quelqu'un voit une autre explication je suis preneur
Marsh Posté le 11-06-2003 à 19:33:35
fouge a écrit : Personne pour me conseiller 1 ou 2 logiciels plus "concrets" que Sandra 2003? |
mmh presque normal 5 c'est pas un règlage stable pour la ram test a 6-2-2-2 pour voir ?
perso juste testé sur epox 8RGA+ 2x512mo corsair pc-3200
mes meilleur perf sont a 6-2-2-2 a partir de 8-2-2-2 je perd des perf... bon meme pas 1% entre 6-2-2-2 et 12-2-2-2
j'ai une 8RGA+ avec de la twinmos CH-5 je testerais ce soir
Marsh Posté le 11-06-2003 à 19:52:16
Lu,
Même phénomène remarqué (je pensait que ct un bug) sur A7N8X avec Corsair PC3200 pour le comparatif en cours. Augmentation de 0.8% de la bp mémoire entre 6 et 8 sous StreamD. Ca n'a rien de logique, et en plus, ca ne le fait pas sur les autres chipsets
Les mystères de l'informatique
Marsh Posté le 11-06-2003 à 20:22:00
Vroom a écrit : C'est de la TwinMos, 2x256mb dual |
meme problème pour moi
Marsh Posté le 11-06-2003 à 22:34:18
au fait vous êtes en dual ou single ddr ???
moi en single je vois pas de perfs notables mais bon ptet que c'est la cas qui limite(samsung)
samsung pc3200 4-3-3-2.5, j'obtiens des perfs légèrement supérieures sous sandra en 6-3-3-2.5 mais c de l'ordre de 20-40 points
Marsh Posté le 12-06-2003 à 09:44:42
amg1> si t'avais tout lu, t'aurais vu que j'ai fait toute les valeurs de 3 à 15 !!!
jeoff> le passage du tRAS de 4 à 12 provoque un gain de + de 60Mo/s
Marsh Posté le 12-06-2003 à 09:51:00
En fait j'ai bien l'impression que c'est une particularité du NForce2
Je précise encore que j'ai 512Mo configurés en Dual-DDR.
Peut-etre que le phénomène disparait en Single?
Marsh Posté le 12-06-2003 à 11:02:02
11 stune bonne valeur apparement
bon v faire qq tests ce soir sur mon a7n8x
Marsh Posté le 12-06-2003 à 11:09:25
ReplyMarsh Posté le 12-06-2003 à 11:31:18
Ce qui est bien c'est que Sandra2003, MBench et PCMark2002 ne se contredisent pas!
Avec un tRAS < 10, les perfs sont les moins bonnes.
Par contre avec une valeur de 13, 14 ou 15, les résultats semblent s'effondrer!
Bref, il apparait que les meilleurs valeurs sont 10, 11 et 12.
J'aurais la même préférence que moyen_moins : tRAS = 11
Cela ne concerne apparemment que le NForce2.
J'ai testé en Dual-DDR. Peut-etre que ce soir je referai tout en single?
Quel est l'explication?
Marco a peut-etre une idée sur le sujet...
Marsh Posté le 12-06-2003 à 11:49:45
Euh aucune
P-e un problème de synchronisme sur le nForce2, mais c'est chelou koi
Marsh Posté le 12-06-2003 à 12:15:15
Je suis pas sûr que de tels logiciels mettent en évidence le changement d'un seul timing mémoire!
Surtout que le tRAS n'a que très peu d'influence sur les perfs dit-on courament...
Et tu crois que la tendance s'inverserai?
5/2/2/2 VS 11/2/2/2
Sinon tu proposes koi comme logiciels (à part Quake3 et UT2003) ?
Des prog dépendant fortement de la mémoire bien entendu
persoguillaume>
Marsh Posté le 12-06-2003 à 12:22:33
Citation : persoguillaume> |
J'avais trop de fenêtres ouvertes en même temps, je me suis planté de discuss. désolé
Marsh Posté le 12-06-2003 à 12:31:57
ou mieux, un UT en null renderer
Marsh Posté le 12-06-2003 à 12:33:48
Voici ma théorie :
Le NForce2, lorsqu'il est en DUAL-DDR utilise, grâce à la BP inutilisée, un cache "intelligent". Lorsque le tRAS est trop grand, le NForce2 est obligé de regarder + souvent ce qu'il y a dans la cache ce qui a pour effet d'augmenter les perfs!
Bon c'est un peu tiré par les cheveux d'autant plus que 2 choses seraient à faire :
1) se renseigner un peu plus sur le fonctionnement en DUAL-DDR du NForce2 (ben oui )
2) vérifier qu'en single, le comportement est "normal" (comme un KT400 par ex)
Marsh Posté le 12-06-2003 à 12:36:16
ReplyMarsh Posté le 12-06-2003 à 12:37:46
et si tu désactive le truc de nv ? (le fameux DSAP
Citation : Mais le principal intérêt de ces puces se situe plus au niveau de leur contrôleur mémoire très performant. Performant en terme de temps de latence tout d´abord, via le DASP, un cache qui profite de la bande passante mémoire inutilisée pour charger des données qui devraient être requises plus tard par le processeur. |
(c) marc)
(mode aggressive sur le bios je crois)
Marsh Posté le 12-06-2003 à 12:38:21
Marc> Oui mais quels paramètres? "tout au mini", Fast, Normal, QH ou "tout au maxi"?
Oxygen3> UT en null renderer c'est le rendu sofware?
Faudrait que tu me dise koi changer dans le INI. J'ai que la demo de UT2003 mais ça ira...
Bon et à part ça? Parmi les logiciels moins "ludiques"?
Marsh Posté le 12-06-2003 à 12:38:55
Marc a écrit : 3DMark2003 CPUMark /D |
b'en le null renderer il est assez bon comme indicateur quand même (il se fout de la carte graph mais fait tout comme si il devait afficher)
pour l'activer, il faut modifier le maxdetails.ini du rep benchmark
[Engine.Engine]
;RenderDevice=D3DDrv.D3DRenderDevice
RenderDevice=Engine.NullRenderDevice
;RenderDevice=OpenGLDrv.OpenGLRenderDevice
et hop!
(rep UT2003\Benchmark\Stuff)
Marsh Posté le 12-06-2003 à 12:41:03
fouge a écrit : Marc> Oui mais quels paramètres? "tout au mini", Fast, Normal, QH ou "tout au maxi"? |
un coup de SPECviewperf 7.0 ?
Marsh Posté le 11-06-2003 à 10:10:11
Dernière MAJ : 19/03/2004
Ce topic a pour but de mettre en évidence le comportement étrange du NForce2(Ultra) en mode Dual-DDR avec un timing mémoire peu connu : le "Row-active delay" appelé aussi "tRAS".
Tout est parti de cette remarque :
Quant au Tras à 9, plus je le baisse et plus je perds en perfs.
INTRODUCTION
Mais avant tout, je vais vous décrire les différents timing mémoire auxquels on a accès dans le bios d'une Abit NF7-S.
Voici le menu Advanced Chipset Features du bios Abit:
Voici la description de ces différents paramètres (ordre et appellation du bios Abit) :
Row-active delay : Permet de régler le nombre minimum de cycles d'horloge nécessaires pour le Tars (Row Active Time) et le Trc (Row Cycle Time).
Valeurs couramment utilisés : entre 5 et 8
RAS-to-CAS Delay : Permet d'ajouter un délai entre les signaux RAS (Row Adress Strobe) et CAS (Column Address Strobe).
Valeurs couramment utilisés : 2 ou 3
Row-precharge delay : Définit le nombre de cycles nécessaires au RAS pour accumuler sa charge éléctrique avant le rafraîchissement.
Valeurs couramment utilisés : 2 ou 3
CAS Latency Time : Contrôle du temps d'attente (en cycle d'horloge , CLK) avant d'effectuer une opération de lecteur en mémoire.
Valeurs couramment utilisés : 2 ou 2.5
Voici un petit schéma de Tomshardware :
Au final, plus ces valeurs sont faibles, plus les transferts mémoire seront rapides, mais cela augmente les risques d'instabilité du système. Tout est histoire de performance contre stabilité.
Cependant, comme nous allons le voir par la suite, il y a une exception !
Voici la machine de test utilisée:
Abit NF7-S v2.0 (bios 14)
2 * 256Mo A-DATA Winbond BH-5 (sur Dimm2&3)
Tbird1200@1300 (1.65V)
Voici les réglages bios utilisés :
FSB : 200MHz (Dual-DDR activé)
RAM : 3:3
CPU Interface : Enabled
Row-active delay : 3 à 15 -> C?est le paramètre testé.
RAS-to-CAS delay : 2
Row-precharge delay : 2
CAS Latency Time : 2.0
J'ai donc fait varier le tRAS de 3 à 15. La valeur 15 étant le maximum permis par le bios, et ma machine n?étant pas très stable en 2-2-2-2
Vous vous attendez à des résultat de ce style ?
En toute logique, oui !
LES TESTS
Voyons maintenant la liste des benchs que j?ai utilisé : Sandra2003, Mbench 1.0, UT2003, Quake3, PCMark2002, 3DMark03, RealStormBench et PiFast 4.2
Cependant UT2003, Quake3, 3Dmark03 et RealStormBench ne montrent aucune variations significative de performances. J?ai donc retenu :
1) Sandra2003 (bench mémoire) : incontournable !
2) Mbench v1.0 : bench mémoire de www.x86-secret.com
3) PCMark2002 (de FutureMark) : juste le score mémoire.
4) PiFast 4.2 : calcul de 50M de décimal de Pi
Résultats obtenus à Sandra 2003 (bench mémoire):
Plus la valeur du tRAS augmente, meilleures sont les performances !
L'augmentaion n'est pas linéaire, elle se fait pas pallier.
Résultats donnés par MBench v1.0 :
Les valeur 10, 11 et 12 semblent les meilleurs. Notons une chute de performances avec un tRAS à 13, 14 ou 15 (sans MMX).
Message édité par Fouge le 27-04-2004 à 22:58:44