[HFR] Dossier : Influence du PCI Express sur les GPU

Dossier : Influence du PCI Express sur les GPU [HFR] - HFR - Hardware

Marsh Posté le 10-06-2011 à 13:56:43   0  

A quelques mois de l'arrivée du PCI Express 3.0 sur nos cartes mères, revenons sur l'impact actuel du PCI Express sur les cartes graphiques. x4, x8, x16, y a-t-il un impact réel dans les jeux ?
Lire la suite ...


Message édité par Marc le 10-06-2011 à 14:56:07
Reply

Marsh Posté le 10-06-2011 à 13:56:43   

Reply

Marsh Posté le 10-06-2011 à 14:02:57   0  

Plus que le PCIe, c'est avant tout le RS-422/485 qui est à la base de tout ça, le PCIe en lui-même étant une surcouche de bas niveau en conjonction avec des normes électriques adaptées, comme c'est le cas de l'Ethernet.

Reply

Marsh Posté le 10-06-2011 à 14:35:28   0  

Très intéressant, merci HFR

Reply

Marsh Posté le 10-06-2011 à 14:47:25   0  

Il serait interessant d'évaluer aussi le 16x chipset des plateformes AMD.

Reply

Marsh Posté le 10-06-2011 à 14:49:51   0  

"Un 'goulet' d'étranglement" ??
Un goulot non ?

Reply

Marsh Posté le 10-06-2011 à 15:00:11   1  

Non, goulet :o
 
Et oui pour ever_over, mais je suppose que c'est prévu avec Llano/Zambezi/SB-E qui arrivent...

Reply

Marsh Posté le 10-06-2011 à 15:45:52   0  

Etes-vous au courant des problèmes liés aux ports PCIe quand on veut utiliser des cartes graphiques dans des grilles de calcul?  
D'après les échos que j'ai pu avoir de personnes bossant sur grille, ce serait lié à la trop faible bande passante du port PCIe (le manque de mémoire des cartes graphiques étant un autre problème) d'où la nécessité de passer en PCIe 3.0 mais je n'ai pas plus d'infos sur ce sujet justement je souhaiterai savoir si vous en avez.
Ciao

Message cité 2 fois
Message édité par Zetein le 10-06-2011 à 15:54:19
Reply

Marsh Posté le 10-06-2011 à 15:48:44   0  

Merci pour ce test hyper pertinent, vivement le suivant avec le multi-GPU !


---------------
Besoin d'un dépannage informatique dans le 41 ?
Reply

Marsh Posté le 10-06-2011 à 16:44:53   0  

Zetein a écrit :

Etes-vous au courant des problèmes liés aux ports PCIe quand on veut utiliser des cartes graphiques dans des grilles de calcul?  
D'après les échos que j'ai pu avoir de personnes bossant sur grille, ce serait lié à la trop faible bande passante du port PCIe (le manque de mémoire des cartes graphiques étant un autre problème) d'où la nécessité de passer en PCIe 3.0 mais je n'ai pas plus d'infos sur ce sujet justement je souhaiterai savoir si vous en avez.
Ciao

AMHA ce n'est pas un autre problème, c'est bien parce quand on arrive dans un cas ou la mémoire manque qu'on a des soucis de perfs, il suffit de comparer les BP du PCIe et de la mémoire interne. Ce n'est pas pour rien que les cartes à base de calcul embarque plus de mémoire.
 
Sinon merci pour l'article!

Reply

Marsh Posté le 10-06-2011 à 17:11:48   0  

J'ai une question bête mais enfin. Dans le cadre d'une utilisation d'une carte NVidia en PhysX sur un slot x8 ou x4, pouvez vous refaire les tests ? :) C'est juste pour trouver une utilité au slot x4 avec du NVidia, genre SLI x8 sur les 2 premiers, et une PhysX sur x4. Oui je sais, j'aurai pu poser la question avant les tests, mais bon...

Reply

Marsh Posté le 10-06-2011 à 17:11:48   

Reply

Marsh Posté le 10-06-2011 à 18:09:09   1  

Il est genial votre article.
 
Merci !

Reply

Marsh Posté le 10-06-2011 à 18:40:59   0  

Zetein a écrit :

Etes-vous au courant des problèmes liés aux ports PCIe quand on veut utiliser des cartes graphiques dans des grilles de calcul?  
D'après les échos que j'ai pu avoir de personnes bossant sur grille, ce serait lié à la trop faible bande passante du port PCIe (le manque de mémoire des cartes graphiques étant un autre problème) d'où la nécessité de passer en PCIe 3.0 mais je n'ai pas plus d'infos sur ce sujet justement je souhaiterai savoir si vous en avez.

Comme dit plus haut, c'est le même type de problème que l'on voit sur notre page théorique, à savoir transférer les données entre le système et le GPU et inversement. Si l'on prend la GTX 570, elle dispose de 140 Go/s de bande passante mémoire entre le GPU et la mémoire GDDR5 embarqué. Au mieux du mieux, avec le PCI Express on passe à 6.4 Go/s (+ les problèmes de latences).
 
Le problème des solutions GPGPU c'est donc d'avoir des algorithmes qui tiennent complètement en mémoire sur la carte (pour la 570, 1.28 Go) pour arriver à être les plus efficaces possibles et tirer partie du GPU. C'est aussi pour ca que les cartes dédiées serveur comme les Tesla de Nvidia embarquent jusqu'a 6 Go de RAM (voir là : http://www.nvidia.com/docs/IO/4339 [...] _lores.pdf. Le PCI Express 3.0 améliorera un peu les choses mais même si l'on avait 14 Go/s théoriques de bande passante, on resterait encore à un dixième de la bande passante du GPU avec sa propre mémoire.
 

Singman a écrit :

J'ai une question bête mais enfin. Dans le cadre d'une utilisation d'une carte NVidia en PhysX sur un slot x8 ou x4, pouvez vous refaire les tests ? :) C'est juste pour trouver une utilité au slot x4 avec du NVidia, genre SLI x8 sur les 2 premiers, et une PhysX sur x4. Oui je sais, j'aurai pu poser la question avant les tests, mais bon...

Il faut voir s'il y a encore beaucoup de jeux qui utilisent encore PhysX GPU, mais c'est une bonne idée, on va regarder ca !
 

Reply

Marsh Posté le 10-06-2011 à 19:48:38   0  

Ce genre de tests montre quand même qu'une carte graphique reste utilisable sur un port x4, en cela nous pouvons entrevoir une des possibilités de LightPeak dans sa forme actuelle (thunderbolt) : proposer à des machines portables un accès à des extensions graphiques augmentant leurs performances (par exemple avec une solution écran+cg relié à l'ordinateur portable) sans gréver leurs mobilité, cela existait déjà mais avec des solutions propriétaires, aujourd'hui avec ce type de ports c'est un large éventail de solution de ce type que l'on peut entrevoir, indépendamment de la marque du portable.

Reply

Marsh Posté le 10-06-2011 à 21:28:31   0  

génial cet article !!! tout simplement parfait !
j'en veux un comme ça tous les jours  :bounce:
 
-----
 
est ce qu'il est possible de partager vos applis/code perso pour les tests ?
je pense tout particulièrement au test OpenCL qui vous permet de mesurer la BP mémoire

Reply

Marsh Posté le 10-06-2011 à 22:12:37   0  

J'attend la suite du dossier (SLI/Crossfire vs 16x 8x 4x) avec grand intérêt.  
En tous cas merci pour cette première partie qui répond à pas mal de mes questions :)

Reply

Marsh Posté le 10-06-2011 à 22:52:40   0  

TRES bon article... Maintenant, il reste a tester dans cette même optique les solutions Bi-GPU (GTX590/HD6990)... ^^


Message édité par Forza971sbh le 10-06-2011 à 22:53:22
Reply

Marsh Posté le 10-06-2011 à 23:36:36   0  

C_Wiz a écrit :

Comme dit plus haut, c'est le même type de problème ...la bande passante du GPU avec sa propre mémoire.


 
Merci pour la réponse c'est un peu plus clair!
Cela fait des années que je lis vos articles mais ça ne fait que récemment que je me suis inscrit, tout ça pour vous dire de continuer à faire des articles aussi sérieux!
Bonne continuation!
Ciao  

Reply

Marsh Posté le 10-06-2011 à 23:59:47   0  

Pour le problème du GPU computing, je me demande si ça n'est pas surtout un souci de niveau de contrôle sur l'exécution...
 
En temps normal, quand on sait qu'on aura pas assez de RAM, on se débrouille pour la gérer soi-même, mais en CUDA/OCL, ça n'est pas si facile, surtout avec des datasets (source, destination... et temporaires) qui peuvent avoir des tailles monumentales.

Reply

Marsh Posté le 11-06-2011 à 00:13:12   0  

Gigathlon a écrit :

mais en CUDA/OCL, ça n'est pas si facile, surtout avec des datasets (source, destination... et temporaires) qui peuvent avoir des tailles monumentales.

C'est aussi parce que l'on a un processeur fortement parrallèle que l'on a tendance a avoir des datasets énormes. Quand à la gestion de la mémoire externe, même s'il y a des efforts de faits dans les applis, ca ne résout pas l'impact sur les perfs.

Reply

Marsh Posté le 11-06-2011 à 01:28:30   0  

C'était un peu le sens de la remarque, le pilote ayant son rôle à jouer.
 
Si le pilote décrète bêtement qu'il faut évincer des données utiles faute de RAM, ça fout toute opti de haut niveau en l'air. Le seul moyen d'éviter ça est de ne travailler qu'avec des datasets minuscules dont les formes temporaires tiennent dans les mini-scratchpads (LDS).


Message édité par Gigathlon le 11-06-2011 à 01:30:36
Reply

Marsh Posté le 11-06-2011 à 10:20:31   0  

Faudrait aussi voir l'impact entre les différentes générations de PCIe a bande passante équivalente. (16x PCIe gen 1 et 8x PCIe gen 2) : le passage au mode full duplex entre les deux gen a fait beaucoup progresser les performances a mon avis :)

Reply

Marsh Posté le 11-06-2011 à 11:56:34   0  

Pour compléter la réponse sur le GPGPU, j'aurais aimé ajouter que les limitations de bande passante ne sont pas forcément les seuls problèmes rencontrés. Pour faire simple, il existe deux grandes classes de problèmes : ceux limités par la mémoire et ceux limités par la puissance de calcul. Le produit de deux matrices entre, par exemple, dans cette seconde catégorie. Pour ce type de problèmes le nombre d'éléments qui peuvent être calculés en une seconde est inférieur à celui qui peuvent être transférés. Dans ce cas, augmenter la bande passante ou la mémoire disponible sur le GPU n'est pas la solution. Il faut augmenter la puissance de calcul (les Flops).


Message édité par jdemouth le 11-06-2011 à 12:49:05
Reply

Marsh Posté le 11-06-2011 à 15:03:18   0  

bon dossier qui ne me surprend pas. Je voulais par contre savoir s'il y avait une bonne différence ente les lignes chipset et les lignes cpu.

Reply

Marsh Posté le 12-06-2011 à 09:34:24   0  

ça aurait été sympa de tester des jeux genre tomb raider anniversary mais en résolution triple screen
l'age du jeu fait qu'il aurait pas trop limité une carte telle la HD6970 en terme gourmandise 3D, mais la résolution 5760*1080 aurait pu donner des indice de besoin en bande passante éventuelle
 
dans l'idée ça aurait pu être un test permettant d'appréhender ce qui nous attend en besoin en bande passante cpu/gpu avec les pas si loin écran 4K

Reply

Marsh Posté le 12-06-2011 à 23:04:41   0  

En réalité, c'est tout l'inverse qui importe...
 
C'est la latence qui peut varier sensiblement, et cette latence s'observera particulièrement en BAISSANT la résolution, car les transferts de textures resteront +/- les mêmes alors que le framerate sera beaucoup plus élevé.
 
Si le CPU bloque 1ms, le PCIe 1-1.5-2ms et la CG 5ms, l'influence du PCIe (et du CPU) sera largement plus sensible que si la CG bloque 50ms.

Reply

Marsh Posté le 14-06-2011 à 13:10:09   0  

Belle et intérrésant article, c'est bon à savoir. Merci HFR. :jap:

Reply

Marsh Posté le 14-06-2011 à 22:24:46   0  

Très bon article !

Reply

Marsh Posté le 15-06-2011 à 03:25:05   0  

Merci de corriger "a mesure".

Reply

Marsh Posté le 20-06-2011 à 21:21:37   0  

Je suis complètement perdu là...
 
Est-ce que le crossfire est toujours nécessaire ou faut-il juste plugger les 2 cartes et le tour est jouer?
 
 
mon cas...
 
J'ai justement acheté une MSI Z68MA-ED55 avec le 2nd port en x4
 
Je compte utiliser l'IGP du 2500K que j'ai acheté avec, histoire de profiter des fonctions du proc et donc de connecter l'écran à la CM et non pas la CG.  
J'ai lu aussi qu'avec l'utilisation de la techo Virtu on perdait un chouilla en performance de la CG (~5%). Bon pas grave tant pis :D
 
Cependant j'envisageais d'acheter 2x5850 (les saphires), mais je vais perdre en puissance car le 2e port PCIE est en x4 sur cette CM. Cependant, en réalisant un OC sur la 5850 de 10 à 20% sur le second port ca va compenser ou pas?  
 
Dernier question, est ce que si je passe par un crossfire classique sans passer par le chipset, je connaitrais ce problème aussi?
 
merci de vos lumieres


Message édité par ash76 le 20-06-2011 à 21:33:19
Reply

Marsh Posté le 23-06-2011 à 09:51:37   0  

Gigathlon > le PCIe une surcouche du RS485 ? Mouais bon le RS485 n'est jamais qu'une specification electrique.
 
Le PCIe est divise en 3 couches principales, qui sont (selon la termes officiels de la spec PCIe):
- physical layer (avec la sous-couche electrique heritee donc du rs485, mais il y a aussi la sous-couche serialisation/framing/encodage qui elle n'est pas specifiee par le RS485)
- data link layer (entre autre l'echange de credit dont parle HFR mais aussi le retry etc...)
- transaction layer (envoi ou reception des "PCIe transaction packets" = commande/adresse/donnees)
 
Donc bon le RS485 dans tout ca n'est qu'une toute petite partie.

Reply

Marsh Posté le 23-06-2011 à 09:53:50   0  

En tous cas excellent article de HFR, je suis ingenieur hardware numerique (FPGA) et j'ai deja concu pas mal de peripheriques PCIe avec controlleurs DMA, et je trouve la qualite de l'article bluffante. Impressionnant comme d'habitude !

Reply

Marsh Posté le 24-06-2011 à 09:59:43   0  

L'utilité de l'article...? Parce que j'ai cherché à l'heure actuelle, mais je n'ai pas trouvé dans le commerce de carte mère limité sur un seul port en PCIe x8. Ce test aurait donc pu servir, mais uniquement pour les config SLI et CF. Enfin vous connaissez peut etre des geeks qui insèrent leur GPU sur le slot du bas, histoire qu'il soit dans la poussière du boitier ^^


Message édité par Badbeat le 24-06-2011 à 10:14:02
Reply

Marsh Posté le 24-06-2011 à 10:00:36   0  

L'utilité de l'article...? Parce que j'ai cherché à l'heure actuelle, mais je n'ai pas trouvé dans le commerce de carte mère limité sur un seul port en PCIe x8. Ce test aurait donc pu servir, mais uniquement pour les config SLI et CF. Enfin vous connaissez peut etre des geeks qui insèrent leur GPU sur le slot du bas, histoire qu'il soit dans la poussière du boitier ^^


Message édité par Badbeat le 24-06-2011 à 10:13:50
Reply

Marsh Posté le 04-07-2011 à 10:07:51   0  

ash76 a écrit :

Je suis complètement perdu là...
 
Est-ce que le crossfire est toujours nécessaire ou faut-il juste plugger les 2 cartes et le tour est jouer?
 
 
mon cas...
 
J'ai justement acheté une MSI Z68MA-ED55 avec le 2nd port en x4
 
Je compte utiliser l'IGP du 2500K que j'ai acheté avec, histoire de profiter des fonctions du proc et donc de connecter l'écran à la CM et non pas la CG.  
J'ai lu aussi qu'avec l'utilisation de la techo Virtu on perdait un chouilla en performance de la CG (~5%). Bon pas grave tant pis :D
 
Cependant j'envisageais d'acheter 2x5850 (les saphires), mais je vais perdre en puissance car le 2e port PCIE est en x4 sur cette CM. Cependant, en réalisant un OC sur la 5850 de 10 à 20% sur le second port ca va compenser ou pas?  
 
Dernier question, est ce que si je passe par un crossfire classique sans passer par le chipset, je connaitrais ce problème aussi?
 
merci de vos lumieres


 
Bonjour, en ce qui me concerne, je viens d'avoir justement le cas de figure ou le xfire est moins intéressant qu'une carte solo:
 
Sur une Asus P7P55d "de base", lles slot pcie passent de x16 "en solo" à x4 en xfire et malgré mes Sapphire vapor-x 5870 oc, ça laggait !  J'ai changé mes 5870 par mes 6950 (de mon 2ième pc sur Asus P7P55D-e Deluxe) et même phénomène! J'en retire une et là: miracle, plus de lag!!!!

Reply

Marsh Posté le 12-07-2011 à 15:02:47   0  

Je viens à peine de voir cet article, excellent comme toujours merci ! :)
Le 4x joue donc.
 
Un petit test du SLI/CF en 16x/8x et 16x/4x serait idéal^^.

Reply

Marsh Posté le    

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed