[HFR] Actu : Nvidia Maximus: Quadro et Tesla s'associent

Actu : Nvidia Maximus: Quadro et Tesla s'associent [HFR] - HFR - Hardware

Marsh Posté le 15-11-2011 à 17:35:01   0  

A l'occasion du SC11 (Supercomputing 2011), Nvidia présente la plateforme Maximus qui permet de combiner une carte Quadro, orientée graphisme professionnel, et ...
Lire la suite ...

Reply

Marsh Posté le 15-11-2011 à 17:35:01   

Reply

Marsh Posté le 15-11-2011 à 18:07:09   0  

Citation :

Dans la gamme Nvidia, les Quadro représentent le sommet absolu


Encore faudrait il que Nvidia ait un naming homogène!
Quadro est plutôt un nom marketing pour designer les cartes "entreprise", comprenant auparavant les séries FX (3D) et NVS (2D/multi-display), et d'autres encore plus spécifiques (CX et VX). Maintenant, les Quadro sans suffixe dont il est question ici sont elles toutes le top en 3D? A voir la liste sur wikipedia
http://en.wikipedia.org/wiki/Quadro
on peut sérieusement douter de la "Quadro 400", avec son bus mémoire 64bits, et même si les drivers "pro" sont fournis!

Reply

Marsh Posté le 15-11-2011 à 18:21:11   0  

Elles sont au top de la gamme en terme de fonctionnalités et de performances pratiques dans les logiciels bridés sur les autres cartes, mais bien entendu pas les plus performantes dans l'absolu.


Message édité par tridam le 15-11-2011 à 19:43:03
Reply

Marsh Posté le 15-11-2011 à 21:56:12   0  

regrette l'epoque où on pouvait flasher une geforce en quadro

Reply

Marsh Posté le 16-11-2011 à 09:22:07   0  

Si on met une ATI en affichage principal et une Tesla en calculateur, ça marche aussi ? :D
=>[]

Reply

Marsh Posté le 16-11-2011 à 10:16:33   0  

Ce genre de cartes sont elles performantes en jeux ou c'est que pour le logiciel spéciaux ?

Reply

Marsh Posté le 16-11-2011 à 11:30:26   0  

Je ne comprends pas trop la nouveauté, j'ai 1 Quadro et 2 Tesla dans mon PC et ça marche très bien :  
 
http://jfdeg256.free.fr/tesla.JPG
 

Reply

Marsh Posté le 16-11-2011 à 11:48:05   0  

Avec quels pilotes ?

Reply

Marsh Posté le 16-11-2011 à 17:21:49   0  

une qaudro et deux tesla fonctionnent sans probleme , mais je pense que tu configure le truc pour que tes calculs soient gérés en tesla, et ton affichage en quadro. A aucun moment tes tesla ne servent à améliorer l'affichage, et la quadro à calculer.

Reply

Marsh Posté le 16-11-2011 à 21:18:58   0  

@ulukai08: il est cool ton PC. Quel système d'exploitation utilises-tu ? Et quelle application développes-tu avec une telle configuration ? Un code multi-GPU en CUDA ?

Reply

Marsh Posté le 16-11-2011 à 21:18:58   

Reply

Marsh Posté le 16-11-2011 à 21:27:20   0  

tridam a écrit :

Avec quels pilotes ?


 
282.quelquechose, je regarderai demain. Mais c'est le même driver pour les Tesla et pour la Quadro.  
 

invisio a écrit :

une qaudro et deux tesla fonctionnent sans probleme , mais je pense que tu configure le truc pour que tes calculs soient gérés en tesla, et ton affichage en quadro. A aucun moment tes tesla ne servent à améliorer l'affichage, et la quadro à calculer.


 
Oui et non. Mes 2 écrans sont évidement connectés sur la Quadro. Quand je lance un calcul je choisis le device sur lequel je veux que ça tourne, je peux choisir la Quadro, ça marche très bien. J'avais aussi fait un essai en connectant directement la Tesla sur l'écran. Ca marche aussi. Je peux toujours calculer sur n'importe quelle carte mais sur les benchs faisant intervenir OpenGL, l'affichage est beaucoup plus lent (le test simpleGL par exemple). L'affichage est aussi généralement moins fluide sur la Tesla mais largement suffisant pour quelqu'un qui ne fait pas de 3D.  
 
C'est pour ça que je comprends pas trop la nouveauté dans ce Maximus.

Reply

Marsh Posté le 16-11-2011 à 21:27:22   0  

tridam a écrit :

Avec quels pilotes ?


 
282.quelquechose, je regarderai demain. Mais c'est le même driver pour les Tesla et pour la Quadro.  
 

invisio a écrit :

une qaudro et deux tesla fonctionnent sans probleme , mais je pense que tu configure le truc pour que tes calculs soient gérés en tesla, et ton affichage en quadro. A aucun moment tes tesla ne servent à améliorer l'affichage, et la quadro à calculer.


 
Oui et non. Mes 2 écrans sont évidement connectés sur la Quadro. Quand je lance un calcul je choisis le device sur lequel je veux que ça tourne, je peux choisir la Quadro, ça marche très bien. J'avais aussi fait un essai en connectant directement la Tesla sur l'écran. Ca marche aussi. Je peux toujours calculer sur n'importe quelle carte mais sur les benchs faisant intervenir OpenGL, l'affichage est beaucoup plus lent (le test simpleGL par exemple). L'affichage est aussi généralement moins fluide sur la Tesla mais largement suffisant pour quelqu'un qui ne fait pas de 3D.  
 
C'est pour ça que je comprends pas trop la nouveauté dans ce Maximus.

Reply

Marsh Posté le 17-11-2011 à 10:02:02   0  

Après avoir regardé plus en détails, je pense que ce nouveau système permet simplement de répartir "intelligemment" les tâches 3D et calcul sur les cartes de façon autonomes dans les logiciels de CAO/calcul.  
 
Pour les personnes faisant leur propres programmes, cela ne change apparemment rien.

Reply

Marsh Posté le 17-11-2011 à 16:24:45   0  

Il s'agit ici de combiner la puissance de calcul de la Quadro et de la Tesla, pas de pouvoir choisir l'une ou l'autre comme vous pouvez déjà le faire, il me semble.


Message édité par Marc le 17-11-2011 à 16:24:58
Reply

Marsh Posté le 17-11-2011 à 17:51:41   0  

Selon Nvidia le but est de pouvoir combiner les deux cartes dans un même système en conservant leurs spécificités et de disposer de profils pour rediriger automatiquement les tâches computer vers la carte Tesla. Mais il ne s'agit pas de combiner la puissance de calcul des 2 cartes bien que cela reste possible manuellement.
 
Maximus étant en projet depuis quelques mois déjà il est possible qu'un support beta soit déjà présent dans les pilotes de la branche 280.

Reply

Marsh Posté le 17-11-2011 à 21:57:56   0  

Dans ce cas le gain en changeant de quadro sur le second graph de la news vient d'ou?

Reply

Marsh Posté le 17-11-2011 à 22:16:37   0  

De la partie graphique en principe d'après ce que dit Nvidia au sujet de Maximus, mais cela semble effectivement peu probable pour cet exemple.

Reply

Marsh Posté le 17-11-2011 à 23:09:52   0  

Sous Windows il existe deux types de drivers pour les cartes Tesla et Quadro: WDDM (Windows Display Driver Model) et TCC (Tesla Compute Cluster). Le WDDM est utilisé pour l'affichage. Ceci dit, il impose de fortes restrictions sur l'utilisation des GPUs qui posent problèmes pour le calcul (par exemple, Windows coupera le calcul si le GPU ne rend pas d'image pendant une certaine période, les latences seront plus élevées, etc). Le mode TCC est plus efficace pour les tâches de calcul. Maximus vient avec un driver unifié qui permet de faire fonctionner les deux modes efficacement (un GPU WDDM et un TCC). Une application qui ferait de l'affichage (un rendu avancé) + du calcul de simulation (de fluides par exemple) pourrait tirer avantage d'un GPU d'affichage et d'un GPU de calcul. Si le temps de rendu est supérieur au temps de calcul (et de transfert), augmenter la puissance du GPU de rendu pourra apporter de la puissance supplémentaire (d'où le résultat avec iray -- même si je ne sais pas précisément quelle partie du calcul est déportée sur la Tesla).

Reply

Marsh Posté le 18-11-2011 à 14:53:45   0  

jdemouth a écrit :

@ulukai08: il est cool ton PC. Quel système d'exploitation utilises-tu ? Et quelle application développes-tu avec une telle configuration ? Un code multi-GPU en CUDA ?


Désolé, je n'avais pas vu ton post. Application défense, traitement du signal, je te laisse deviner pour quels systèmes ;) Je suis sous linux debian, et oui pour le moment CUDA multi GPU, le multi-GPU n'est pas très subtile, je divise mes données en 2 en j'envoi chaque moitié sur un GPU. J'envisage de passer sur OcL mais il faut voir la perte de temps en programmation pour les gains en portabilité.  
 
 

tridam a écrit :

Avec quels pilotes ?


280.13, il faudra que je les mette à jour !
 
 

tridam a écrit :

De la partie graphique en principe d'après ce que dit Nvidia au sujet de Maximus, mais cela semble effectivement peu probable pour cet exemple.


C'est peu probable en effet !

jdemouth a écrit :

Sous Windows il existe deux types de drivers pour les cartes Tesla et Quadro: WDDM (Windows Display Driver Model) et TCC (Tesla Compute Cluster). Le WDDM est utilisé pour l'affichage. Ceci dit, il impose de fortes restrictions sur l'utilisation des GPUs qui posent problèmes pour le calcul (par exemple, Windows coupera le calcul si le GPU ne rend pas d'image pendant une certaine période, les latences seront plus élevées, etc). Le mode TCC est plus efficace pour les tâches de calcul. Maximus vient avec un driver unifié qui permet de faire fonctionner les deux modes efficacement (un GPU WDDM et un TCC). Une application qui ferait de l'affichage (un rendu avancé) + du calcul de simulation (de fluides par exemple) pourrait tirer avantage d'un GPU d'affichage et d'un GPU de calcul. Si le temps de rendu est supérieur au temps de calcul (et de transfert), augmenter la puissance du GPU de rendu pourra apporter de la puissance supplémentaire (d'où le résultat avec iray -- même si je ne sais pas précisément quelle partie du calcul est déportée sur la Tesla).


Nous n'avons pas tout ça sous linux. Ca m'a l'air bien compliqué !


Message édité par ulukai08 le 18-11-2011 à 14:54:32
Reply

Marsh Posté le 18-11-2011 à 15:12:19   0  

@ulukai08: Il n'y a effectivement pas les mêmes difficultés avec Linux :). Le driver "stable" pour CUDA est le 270.41.19 (sous Linux) et le "unstable" est le 285.05.15 (mais il faut être Reg. Developer).

Reply

Marsh Posté le 18-11-2011 à 15:24:52   0  

@ulukai08: avec un code OpenCL sur une Tesla C2050, ça fait mal au coeur (et à la productivité) de ne pas pouvoir utiliser cuda-gdb et cuda-memcheck...

Reply

Marsh Posté le 18-11-2011 à 15:49:25   0  

jdemouth a écrit :

@ulukai08: avec un code OpenCL sur une Tesla C2050, ça fait mal au coeur (et à la productivité) de ne pas pouvoir utiliser cuda-gdb et cuda-memcheck...


 
Oui, mais je voudrais voir les perfs sur une ATI et voir aussi si le code OpenCl tourne mieux sur CPU multicoeur que mon code OpemMP. D'ailleurs je me demande si je peux en rajouter une Radeon sur le dernier port PCIe.
 
Je suis reg developper, j'avais dû les prendre il y a quelque temps lors que c'était les derniers. Pas de soucis à signaler avec.


Message édité par ulukai08 le 18-11-2011 à 15:49:44
Reply

Marsh Posté le 18-11-2011 à 16:13:16   0  

@ulukai08: Ce n'est pas forcément à prendre comme une vérité générale, mais les rares développeurs que je connais qui ont tenté OpenCL contre OpenMP sur CPU n'ont pas été ravi du résultat. Autrement, sans entrer dans les détails de ton application, tu dois probablement utiliser des FFT pour faire du traitement du signal, non ? Si oui, CUFFT ou un code maison ?


Message édité par jdemouth le 18-11-2011 à 16:16:01
Reply

Marsh Posté le 18-11-2011 à 16:40:09   0  

cufft mais pour OcL ça devra être un code maison. Et je pense que je serai loin d'atteindre les perfs de cufft ou de FFTw.
 

Reply

Marsh Posté le 18-11-2011 à 20:59:42   0  

@ulukai08: C'est bien de viser haut. Je me demande s'il est même possible d'avoir une implémentation OpenCL du même algorithme de la FFT aussi performante que notre version CUDA. Il est fort possible que le code utilise des "intrinsics" CUDA et du PTX inliné. Il y a bien quelques années, V. Volkov (un chercheur américain) avait développé une version de la DGEMM plus efficace que CUBLAS. Ceci dit, il l'avait fait en CUDA.

Message cité 1 fois
Message édité par jdemouth le 18-11-2011 à 21:05:48
Reply

Marsh Posté le 19-11-2011 à 14:06:58   0  

jdemouth a écrit :

@ulukai08: C'est bien de viser haut. Je me demande s'il est même possible d'avoir une implémentation OpenCL du même algorithme de la FFT aussi performante que notre version CUDA. Il est fort possible que le code utilise des "intrinsics" CUDA et du PTX inliné. Il y a bien quelques années, V. Volkov (un chercheur américain) avait développé une version de la DGEMM plus efficace que CUBLAS. Ceci dit, il l'avait fait en CUDA.


 
 
Oui d'ailleurs je crois que la version de CUBLAS actuelle utilise son code. Étant donné les perfs de CUFFT par rapport à FFTw, même si OpenCL n'arrive qu'à 40 % des perfs de CUFFT, ça sera déjà largement suffisant.  
 
Une recherche rapide montre que ça existe déjà :  
 
http://www.bealto.com/gpu-fft_benchmarks-1.html
 
Mais quand je vois les codes OpenCL ça me rebute un peu :)

Reply

Marsh Posté le    

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed