GTC: Nvidia lève le voile sur le GK110

Tags : GK110; GTC; Kepler; Nvidia; Tesla;
Publié le 16/05/2012 à 00:40 par
Imprimer


Sans le nommer directement, Jen-Hsun Huang, le CEO de Nvidia, vient de dévoiler les premières informations au sujet du "gros" GPU Kepler, le GK110. Nous avons tout d'abord la confirmation qu'il s'agit bien d'un énorme GPU de pas moins de 7.1 milliards de transistors fabriqués en 28nm, un nouveau record. Certains doutes subsistaient par rapport à ce chiffre puisqu'il correspond presqu'exactement à deux GPU GK104, la configuration de la nouvelle carte Tesla K10, mais ce n'est qu'une coïncidence.

GTC oblige, c'est avant tout son intérêt pour le monde professionnel et particulièrement pour le calcul haute performance qui est mis en avant par Nvidia. Deux nouvelles technologies importantes font leur apparition dans ce GPU. Tout d'abord Hyper-Q qui permet d'utiliser jusqu'à 32 queues d'exécution pour alimenter le GPU, contrairement à une seule auparavant. Une limitation qui empêchait dans bien des cas la pleine exploitation de toute la capacité de calcul des GPU.



Hyper-Q permet de maximiser le rendement du GPU et de réduire le temps d'exécution.

La seconde innovation se nomme Dynamic Parallelism et vient également apporter une réponse à un problème d'efficacité actuelle. Le travail à exécuter sur le GPU est en général segmenté, et chacun des segments est initié par le CPU. Entre chacun de ceux-ci, le GPU rend ainsi la main au CPU qui reçoit les résultats d'une fonction, et dans certains cas renvoie ces mêmes résultats au GPU pour lancer une seconde fonction qui en est dépendante. L'inefficacité est évidente. Dynamic Parallelism représente la capacité du GK110 à auto-générer de nouvelles tâches, de quoi éviter ces allers-retours entre le CPU et le GPU.


Cette nouvelle flexibilité dans l'exécution des tâches va faciliter le travail des développeurs d'une part en proposant plus simplement un rendement élevé et d'autre part en leur permettant d'écrire leurs programmes d'une façon plus naturelle.


Enfin, Nvidia a dévoilé une photo du die du GK110, certes retravaillée artistiquement mais qui permet de se faire quelques idées sur les spécifications de ce GPU. On peut tout d'abord observer la présence de 15 SMX et d'un contrôleur mémoire de 6x 64 bits, soit 384 bits. Nvidia nous a confirmé ces spécifications et précisé que les SMX du GK110 seront également équipés de 192 unités de calcul, comme pour le GK104. Leur nombre total sera donc de 2880 et là aussi il s'agit d'un nouveau record, même si Nvidia précise qu'il n'y aura en principe pas de dérivé Tesla équipé d'une version complète de ce GPU, profiter d'un certain niveau de redondance étant nécessaire avec un GPU d'une telle taille, plus de 500mm². La première carte Tesla K20 basée sur le GK110 sera probablement limitée à 13 SMX et 2496 unités de calcul.

Nvidia nous a indiqué que l'organisation des registres et de la mémoire partagée avait été revue, et que la puissance de calcul en double précision était très élevée, mais il faudra patienter encore un jour ou deux avant d'avoir plus de détails sur le sous-système mémoire du GK110.

Sur le plan graphique, nous pouvons supposer que chaque SMX conserve 16 unités de texturing et que leur nombre total dans ce GPU est de 240. L'organisation des SMX en 5 groupes de 3 nous laisse penser que le GK110 serait capable de traiter jusqu'à 7.5 triangles par cycle mais de n'en rendre que 5 ou 6 par cycle (suivant l'implémentation pour laquelle a opté Nvidia), contre 4 et 4 pour le GK104. Enfin, de toute évidence il disposera de 48 ROP.

Ce futur GPU sera tout d'abord introduit à la fin de l'année en tant que Tesla K20 mais ne débarquera pas en tant que GeForce avant début 2013. Il sera bien entendu intéressant d'observer la consommation d'un tel monstre, même si Nvidia se veut rassurant en précisant que la carte Tesla K20 est prévue avec un TDP classique de "seulement" 225W !

Vos réactions

Top articles