Nvidia GeForce GTX 660, Asus DirectCU II TOP et SLI en test Cartes Graphiques Publié le Vendredi 14 Septembre 2012 par Damien Triolet URL: /articles/876-1/nvidia-geforce-gtx-660-asus-directcu-ii-top-sli-test.html Page 1 - Introduction Après avoir décliné le GPU GK104 dans le haut de la famille GeForce GTX 600, Nvidia y introduit le GK106, un second GPU destiné à démocratiser l'architecture Kepler auprès des joueurs. De quoi pouvoir enfin donner du fil à retordre aux Radeon HD 7800 ? C'est ce que nous allons vérifier à travers ce test complet de la GeForce GTX 660 dans lequel nous nous intéresserons notamment aux performances en SLI, à la variante DirectCU II TOP d'Asus et à l'intérêt de l'upgrade d'une carte d'ancienne génération. Kepler pour tousNvidia a pu placer le GK104 dans de nombreux produits pour couvrir toute l'étendue du segment haut de gamme voire même descendre dans le segment de prédilection des joueurs, "Performance", compris entre 200€ et 300€. La GeForce GTX 660 Ti, qui s'approche des 300€, ne permet cependant pas à Nvidia d'être réellement compétitif dans ce segment face aux Radeon HD 7800 qui y sont bien ancrées depuis leur lancement il y a 6 mois. Etant donné qu'il s'agit d'un des segments de marché les plus importants, Nvidia ne pouvait bien entendu pas l'ignorer et se contenter d'y laisser les produits en fin de vie de la génération précédente ne pouvait qu'être temporaire. Pour pouvoir démocratiser l'architecture Kepler auprès des joueurs, le GK107 dérivé dans une version plus véloce (mais visiblement pas suffisamment pour que Nvidia soit enthousiaste à l'idée que la presse spécialisée s'y intéresse de trop près…), la GeForce GTX 650, n'est pas suffisant. Un GPU intermédiaire entre le GK104 et le petit GK107 était nécessaire. C'est ici que prend place la GK106, introduit tout d'abord avec la GeForce GTX 660 annoncée à 230€, avant de passer sous la barre des 200€ d'ici quelques semaines à travers la future GeForce GTX 650 Ti. Page 2 - Le GK106 : 5 SMX et 192-bit Le GK106Le GK106 reprend la même variante de l'architecture Kepler que le GK104 dont il ne se différencie que par une configuration différente. Il conserve ainsi l'organisation des unités de calcul en SMX qui englobent chacun 192 unités de calcul, 16 unités de texturing et un cache L1 de 64 Ko. Le SMX représente une évolution du SM de la génération précédente, optimisée pour un rendement supérieur, notamment sur le plan énergétique. Nous avions décrit cette évolution en détail dans le test de la GeForce GTX 680. Chaque SMX est capable de débiter jusqu'à 192 instructions FMA par cycle (384 flops), 4 pixels par cycle ainsi qu'un triangle tous les 2 cycles. L'interface mémoire est également du même type avec des blocs contenant un contrôleur mémoire de 64 bits, optimisé pour la GDDR5 haute fréquence, un cache L2 de 128 Ko et 8 ROP chargés d'écrire les pixels après leur rendu. Alors que le GK104 intègre 8 SMX et 4 contrôleurs mémoire, le GK106 s'en contente respectivement de 5 et 3. Il dispose ainsi au total de 960 unités de calcul, de 80 unités de texturing, d'un cache L2 de 384 Ko, d'un bus mémoire de 192-bit et de 24 ROP. Ses débits passent de 32 pixels et 4 triangles par cycle pour le GK104 à 20 pixels et 2.5 triangles par cycle. Vous remarquerez que le débit de pixels est limité par le nombre de SMX (5 x 4), bien que les ROP soient capables d'en écrire 24 par cycle. Ces ROP supplémentaires peuvent cependant être utiles dans le cas du traitement de l'antialiasing de type multisample qui peut ajouter une charge importante à leur niveau. Comme le GK104, le GK106 est fabriqué en 28 nanomètres chez TSMC. Le nombre réduit de blocs d'exécution lui permet de se contenter de 2.5 milliards de transistors contre 3.5 milliards pour le GK104 soit une complexité proche de celle du GPU Pictcairn dont les 2.8 milliards de transistors animent les Radeon HD 7800. De quoi réduire les coûts de fabrication puisque cela correspond à une surface de 214 mm² pour le GK106, 212 mm² pour Pitcairn et 294 mm² pour le GK104. Vous noterez qu'AMD semble conserver une densité de transistors légèrement plus élevée, probablement parce que son architecture repose sur une quantité plus élevée de SRAM pour ses différents caches et autres registres. Page 3 - Spécifications, la GeForce GTX 660 de référence Spécifications Tout comme les autres GeForce 600, la GTX 660 ne supporte pas complètement Direct3D 11.1, seules les Radeon HD 7700, 7800 et 7900 supportent le niveau de fonctionnalité 11_1, le plus évolué. Vous pourrez retrouver plus de détails à ce sujet dans notre dossier consacré à DirectX 11.1. La GeForce GTX 660 affiche une bande passante mémoire identique à celle de la GTX 660 Ti et très proche de celle des Radeon HD 7800 pourtant équipées d'un bus mémoire plus large. Un résultat obtenu grâce à l'utilisation d'une mémoire GDDR5 plus rapide. Au niveau de la puissance de calcul et de texturing, elle se situe cependant près de 25% en retrait par rapport à la GTX 660 Ti. Par rapport aux Radeon HD 7800, elle se place à mi-chemin au niveau de la puissance de calcul, domine du côté du plaquage de textures et du traitement géométrique, mais reste en retrait pour le fillrate. Tout comme les autres GTX 600, la GTX 660 supporte GPU Boost pour augmenter la fréquence GPU lorsque la consommation reste sous une certaine limite. Rappelons que contrairement aux CPU et aux Radeon, ce turbo est variable suivant la consommation, mais également suivant une limite en fréquence différente pour chaque échantillon. Nous avions décrit tout ceci sur cette page. Comme sur plusieurs autres de ses cartes graphiques, Nvidia exploite ici une configuration mémoire asymétrique : 2 Go interfacés en 192-bit. En pratique cela signifie que la GeForce GTX 660 dispose d'un espace mémoire de 1.5 Go rapide, en 192-bit, et d'une réserve de 512 Mo plus lente, en 64-bit. Il revient aux pilotes de n'utiliser cette dernière partie qu'en dernier recours ou pour des données dont les accès ne sont pas courants. La GeForce GTX 660 de référenceNvidia nous a fourni une GeForce GTX 660 de référence : La GeForce GTX 660 de référence peut sembler identique aux GTX 670 et GTX 660 Ti. Elle est relativement compacte avec 24cm de long et le PCB l'est encore plus puisqu'il se contente de 17.2 cm ! De quoi donner à ces GeForce un design pour le moins original avec une rallonge en plastique à l'arrière du PCB qui permet de rendre la carte suffisamment longue pour accueillir un ventilateur radial, ou turbine. Elle s'en différencie cependant sur plusieurs points, notamment parce que sa consommation a été revue à la baisse : son TDP est de 140W et sa cible de consommation pour GPU Boost est de 115W. Pour rappel cela signifie que GPU Boost peut augmenter la fréquence au-delà de la fréquence de base tant que la consommation ne dépasse pas 115W, mais ne réduira pas la fréquence sous celle de base tant que le GPU ne dépasse pas 140W. En pratique, ce dernier cas ne se rencontre que dans les stress tests tels que Furmark et OCCT. Avec cette consommation réduite, Nvidia peut se contenter d'un bloc de refroidissement très basique : un radiateur en aluminium équipé d'un large insert en cuivre à sa base. Il est légèrement différent de celui qui équipe les GeForce GTX 670 et 660 Ti : si son volume est similaire, l'insert en cuivre est plus mince et les ailettes moins nombreuses. Une coque classique referme le tout. La qualité de finition de l'ensemble est plutôt moyenne, bien en-déca de ce à quoi nous nous attendons pour des cartes de référence. Une partie des exemplaires semblent d'ailleurs souffrir d'un bruit mécanique au niveau du ventilateur ou de son support, un problème que nous avons rencontré à divers degré sur nos GTX 670, GTX 660 Ti et GTX 660 de référence. Pour alimenter le GK106, Nvidia a prévu 4 phases analogiques sur son PCB, en plus d'une dédiée à la mémoire GDDR5 Hynix R0C certifiée à 1.5 GHz. La GeForce GTX 660 se contente d'un connecteur d'alimentation 6 broches, ce qui correspond à une consommation maximale de 150W selon les spécifications PCI Express, en accord avec le TDP visé. Le PCB diffère de celui des GTX 670 et GTX 660 Ti en repositionnant l'étage d'alimentation à l'arrière de la carte et non entre le GPU et les sorties vidéo. De quoi faciliter son refroidissement. La connectique est identique à celle des GTX 680, GTX 670 et GTX 660 Ti : elle propose 2 connecteurs DVI Dual Link, un connecteur HDMI 1.4a 3 GHz et un connecteur DisplayPort 1.2. Tout comme le GK104, le GK106 peut piloter jusqu'à 4 écrans simultanément. Notre échantillon de GTX 660 était capable de monter jusqu'à 1097 MHz grâce à GPU Boost, soit 65 MHz de plus que la fréquence garantie. En pratique, sa consommation l'empêchait cependant d'en profiter pleinement. Page 4 - Asus GTX 660 DirectCU II TOP Asus a pu nous fournir à temps un exemplaire de son premier modèle personnalisé : Asus GeForce GTX 660 DirectCU IIAsus propose 3 versions de sa GeForce GTX 660 personnalisée. Elles reprennent un design proche de celui des GTX 670 et GTX 660 Ti DirectCU II de la marque : Asus GeForce GTX 660 DirectCU II (DC2) : 250€ Asus GeForce GTX 660 DirectCU II OC (DC2O) : 260€ Asus GeForce GTX 660 DirectCU II TOP (DC2T) : 280€ La version OC voit son GPU passer de 980/1033 MHz (base/boost garanti) à 1019/1084 MHz et la version TOP à 1071/1136 MHz. La mémoire passe de son côté de 1502 MHz à 1527 MHz sur cette dernière. Asus nous a fourni un échantillon de test du modèle TOP. Très souvent, les échantillons presse sont soigneusement sélectionnés, soit pour leur potentiel d'overclocking soit pour leur faible consommation et par conséquent leur faibles nuisances sonores. Dans le cas des échantillons de GTX 600 c'est plutôt leur coopération vis-à-vis de GPU Boost qui leur vaut d'être sélectionné. Cela ne semble cependant pas être le cas cette fois-ci. Alors que la fréquence GPU Boost garantie est de 1136 MHz (+6 bins), notre exemplaire se limitait en pratique à 1175 MHz, très loin de ce que nous avions pu observer sur les GTX 670 et GTX 660 Ti Asus capable de monter automatiquement jusqu'à près de 1300 MHz. Notez que pour mieux profiter de la fréquence maximale, Asus a augmenté la limite de consommation GPU Boost de 115W à 130W et le TDP probablement de 140 à 155W. Asus reprend ici son système de refroidissement DirectCU II classique, en version double slot, identique à celui des GeForce GTX 670 et 660 Ti. La base en aluminium profite de 3 caloducs en cuivre nickelé de 8mm de diamètre incrustés et au contact direct avec le GPU. Ils rejoignent un large radiateur surmonté par 2 ventilateurs de 75mm low profile. La seule différence est à chercher du côté esthétique puisqu'à Asus a remplacé la traditionnelle coque en métal par une coque en plastique, pour réduire les coûts. Le PCB est entièrement personnalisé, et 1cm plus long que pour les GTX 670 et 660 Ti de la marque : 28 cm au total. Si Asus a repris la connectique de référence (2 DVI, 1 HDMI, 1 DisplayPort), l'étage d'alimentation a été totalement revu. Alors que le PCB de référence prévoit 4 phases analogiques pour alimenter le GPU, ce modèle DirectCU II en dispose de 6 digitales. Comme sur la carte de référence, une seule phase est ici chargée de la mémoire. Un seul connecteur d'alimentation 6 broches est nécessaire. Son accès est par ailleurs quelque peu difficile et lors du retrait du câble, il faudra forcer légèrement sur le radiateur pour l'écarter du PCB. Notez que compte tenu du TDP en hausse sur la GTX 660 DirectCU II TOP, il aurait été souhaitable qu'Asus prévoie 2 connecteurs d'alimentation sur ce PCB. En l'état Asus frôle les limites de consommations autorisées, ce qui en cas d'overclocking pourra poser problème au niveau de la source 12V fournie à travers la bus PCI Express sur des cartes-mères d'entrée de gamme. La carte est livrée avec un CD qui contient les pilotes, un petit guide de montage, un adaptateur DVI vers VGA et un câble convertisseur d'alimentation double molex vers PCIE 6 broches. Page 5 - Bruit, températures et thermographie Nuisances sonoresNous plaçons les cartes dans un boîtier Cooler Master RC-690 II Advanced et mesurons le bruit d'une part au repos et d'autre part en charge. Un SSD est utilisé et tous les ventilateurs du boîtier ainsi que celui du CPU sont coupés pour la mesure. Le sonomètre est placé à 60cm du boîtier fermé et le niveau de bruit ambiant se situe à moins de 20 dBA, ce qui est la limite de sensibilité pour laquelle il est certifié et calibré. Notez que pour toutes les mesures de bruit et de températures, nous nous sommes basés sur le vrai design de référence pour la Radeon HD 7950, différent de la carte presse fournie par AMD. Nous n'avons pas pu faire de mesures similaires pour la Radeon HD 7950 v2. Rappelons que, malheureusement, le système de refroidissement de référence des GeForce GTX 670 et 660 Ti, qui est identique, souffre sur une partie des cartes d'un bruit mécanique ou de vibration très gênant, qui affecte bien plus le ressenti que les mesures de niveaux sonores. C'est le cas pour notre GTX 670 de référence et dans une moindre mesure également pour notre GTX 660 Ti de référence. Ce bruit mécanique est également présent sur la GTX 660, et nous nous demandons s'il ne serait pas lié au choix d'un ventilateur radial de qualité discutable. Dans le cas de ce modèle, ce bruit mécanique ne transparaît pas dans nos relevés. La carte étant plutôt silencieuse en dehors de ce bruit mécanique, il ressort particulièrement au repos, d'autant plus lorsqu'elle n'est pas dans un boîtier fermé. Une fois de plus, la solution DirectCU II d'Asus obtient ici d'excellents résultats, elle est silencieuse au repos et reste discrète en charge, plus que certaines autres cartes graphiques au repos ! Précisons cependant que le modèle DirectCU II n'expulse pas l'air en dehors du boîtier, ce qui simplifie ici sa tâche. TempératuresToujours placées dans le même boîtier, nous avons relevé la température du GPU rapportée par la sonde interne : La solution d'Asus est très bien refroidie, ce qui, lié aux bons résultats sonores, témoigne des très bonnes performances du système de refroidissement DirectCU II. Voici ce que tout cela donne à travers l'imagerie thermique :
Ramener l'étage d'alimentation de la GTX 660 au bout de la carte est de toute évidence bénéfique au niveau de la température de ses composants, même s'ils ne reçoivent pas de dissipateur dédié. On peut remarquer que l'étage d'alimentation de la carte DirectCU II d'Asus est relativement chaud au repos, ce qui témoigne d'une consommation anormalement élevée dans ce mode. Page 6 - Consommation et performances/watt ConsommationNous avons utilisé le protocole de test qui nous permet de mesurer la consommation de la carte graphique seule. Nous avons effectué ces mesures au repos sur le bureau Windows 7 ainsi qu'en veille écran de manière à observer l'intérêt de ZeroCore Power. Pour la charge, nous avons opté pour des mesures dans Anno 2070, en 1080p avec tous les détails poussés à leur maximum, ainsi que dans Battlefield 3, en 1080p dans le mode High : La GeForce GTX 660 de référence voit sa consommation chuter au repos par rapport à ses grandes sœurs, le GK106 étant visiblement plus économe que la GK104. En charge, la carte est en général très proche de la cible de consommation de GPU Boost, soit 115W, ce qui indique que la marge est relativement faible et que la carte ne pourra pas maintenir sa fréquence maximale la plupart du temps, contrairement à une GeForce GTX 680 par exemple. Pour sa GTX 660 DirectCU II TOP, Asus a opté pour une cible de consommation de 130W, ce qui donne plus de marge au GPU. Malgré la fréquence supérieure, cette marge n'est pas nécessaire dans le cas de Battlefield 3 où la consommation reste sous les 115W, une des raisons étant que le GPU de notre échantillon Asus se contente de 1.162V au maximum, contre 1.175V pour celui de la carte de référence. Cette marge supplémentaire est par contre totalement exploitée dans Anno 2070, plus gourmand. Notez que ce modèle Asus a alors tendance à frôler la limite de consommation spécifiée pour le 12V du port PCI Express : 5.4A pour une limite de 5.5A. Dans un jeu lourd avec overclocking ou dans un stress test tel que Furmark nous nous sommes approchés de 6.5A, ce que certaines cartes-mères d'entrée de gamme pourraient ne pas apprécier. Il est dommage qu'Asus n'ait pas intégré 2 connecteurs d'alimentation 6 broches sur son PCB et exploité cette possibilité avec le modèle TOP. Etrangement, la consommation au repos de la GTX 660 TOP d'Asus bien plus élevée que celle de la carte de référence. Un comportement qui ne se retrouve pas sur les échantillons fourni à certains autres confrères et qui pourrait par exemple être lié à un bios qui ne laisserait pas le nombre de phases actives se réduire au repos. Nous avons fait part de ces résultats étranges à Asus, qui n'y a cependant pas encore apporté d'explication. Nous avons mis en relation ces mesures de consommation avec les performances, en retenant des fps par 100W pour que les données soient plus lisibles : [ Anno 2070 1080p Max ] [ Battlefield 3 1080p High ] Le GK106, tout du moins dans sa version GTX 660 est moins efficace que le GK104 dans ses versions GTX 670 et 660 Ti, ce qui s'explique probablement par son niveau de fréquence plus élevé. Notons que chaque jeu représente un cas particulier et que le rendement varie d'un exemplaire de chaque carte à l'autre, parce que leur niveau de consommation réel varie et pour les GeForce parce que leur fréquence maximale et donc leurs performances varient. Dans cet exemple, la GeForce GTX 680 est capable de monter jusqu'à 1110 MHz, la GeForce GTX 670 jusqu'à 1084 MHz, la GeForce GTX 660 Ti jusqu'à 1071 MHz et la GeForce GTX 660 jusqu'à 1097 MHz. Page 7 - Performances théoriques : pixels Notez que pour toutes les performances théoriques, les GeForce GTX 600 tournaient à leur fréquence GPU maximale respective, à savoir 1110 MHz pour la GTX 680, 1084 MHz pour la GTX 670, 1071 MHz pour la GTX 660 Ti et 1097 MHz pour la GTX 660. Performances texturingNous avons mesuré les performances lors de l'accès à des textures de différents formats en filtrage bilinéaire : en 32 bits classique (8x INT8), en 64 bits "HDR" (4x FP16), en 128 bits (4x FP32), en profondeur de 32 bits (D32F) et en 32 bits RGB9E5, un format HDR introduit par DirectX 10 qui permet de stocker des textures HDR en 32 bits avec quelques compromis. Les GeForce GTX sont capables de filtrer les textures FP16 à pleine vitesse contrairement aux Radeon qui compensaient jusqu'ici par une puissance de filtrage tellement supérieure, que même si elles devaient filtrer les textures FP16 à demi-vitesse, elles affichaient des débits proches des GeForce. Ce n'est plus le cas avec les GeForce GTX 600 qui prennent une avance considérable sur ce point. Cependant, dans ce test, les GeForce GTX 600 ont du mal à atteindre leur débit maximal alors que leur fréquence GPU est pourtant maximale. Les Radeon HD 7700 et 7800 ont également du mal à atteindre leur maximum théorique, cette fois parce que PowerTune les en empêche en réduisant la fréquence GPU, estimant que le niveau de consommation est trop élevé lorsque leurs unités de texturing sont saturées. Ce n'est pas le cas pour les Radeon HD 7900. FillrateNous avons mesuré le fillrate sans et puis avec blending, et ce avec différents formats de données : [ Standard ] [ Avec blending ] Au niveau du fillrate, les GeForce GTX 600 et les GPU GK104/GK106 sont enfin capables de transférer les formats FP10/11 et RGB9E5 à pleine vitesse vers les ROP, bien que le blending de ces formats se fasse toujours à demi vitesse. Si les GeForce et les Radeon sont capables de traiter le FP32 simple canal à pleine vitesse sans blending, seules ces dernières conservent ce débit avec blending. Elles sont par ailleurs nettement plus rapides en FP32 quadruple canal (HDR 128 bits). Les GeForce semblent cependant faire un meilleur usage de leur bande passante mémoire disponible dans le cas du FP16 avec blending. Bien que les Radeon 7800 disposent du même nombre de ROP que les Radeon HD 7900, leur bande passante mémoire inférieure ne leur permet pas de maximiser leur utilisation avec blending ainsi qu'en FP16 et FP32 sans blending. Page 8 - Performances théoriques : géométrie Notez que pour toutes les performances théoriques, les GeForce GTX 600 tournaient à leur fréquence GPU maximale respective, à savoir 1110 MHz pour la GTX 680, 1084 MHz pour la GTX 670, 1071 MHz pour la GTX 660 Ti et 1097 MHz pour la GTX 660. Débit de trianglesEtant donné les différences architecturales des GPUs récents au niveau du traitement de la géométrie, nous nous sommes évidemment penchés de plus près sur le sujet. Tout d'abord nous avons observé les débits de triangles dans deux cas de figure : quand tous les triangles sont affichés et quand ils sont tous rejetés (parce qu'ils tournent le dos à la caméra) : Les GeForce GTX 600 ne font pas mieux que les Radeon HD 7900/7800 lorsque les triangles doivent être rendus, peut-être parce qu'elles sont engorgées à un endroit ou à un autre, ou encore parce que leurs performances ont été réduites artificiellement pour différencier les Quadro des GeForce. Quand les triangles peuvent être éjectés du rendu, les GeForce GTX 600 profitent pleinement de leur capacité de prise en charge de 4 et 3.5 ou 2.5 triangles par cycle pour prendre le large. Ensuite nous avons effectué un test similaire mais en utilisant la tessellation : Avec les GeForce GTX 600, Nvidia réaffirme sa supériorité lorsqu'il s'agit de traiter un nombre important de petits triangles générés par un niveau de tessellation élevé, les Radeon HD 7900 ne se démarquant pas des Radeon HD 7800 qui disposent du même nombre d'unités fixes dédiées à cette tâche. L'architecture des Radeon fait qu'elles peuvent être engorgées par la quantité de données générées, ce qui réduit drastiquement leur débit dans ce cas. Le doublement de la taille du buffer dédié à l'unité de tessellation dans le GPU des Radeon HD 6800 leur a permis d'être significativement plus performantes que les Radeon HD 5000. AMD a continué dans cette voie avec les Radeon HD 7000. Pour une raison inconnue, la GeForce GTX 580 est dans ce test relativement peu performante, et souffre peut-être également d'un engorgement, bien qu'il soit possible ici aussi que ce soit lié à un profil géométrique des pilotes ou à une limitation destinée à favoriser les Quadro. Page 9 - Protocole de test Protocole de testPour ce test, nous avons légèrement revu notre protocole, en retirant Bulletstorm et Metro 2033, ce dernier tirant se révérence après près de 2 ans et demi de service. Nous y avons par contre ajouté l'excellent Sleeping Dogs. Tous ces jeux sont testés avec leur dernier patch, la plupart étant maintenus à jour via Steam/Origin. Nous avons décidé de ne plus utiliser le niveau de MSAA (4x et 8x), comme critère principal pour segmenter nos résultats. De nombreux jeux au rendu différé proposent d'autres formes d'antialiasing, la plus courante étant le FXAA développé par Nvidia. Cela n'a donc plus de sens d'organiser un indice autour d'un certain niveau d'antialiasing, ce qui nous permettait par le passé de nous focaliser sur l'efficacité du MSAA. En 1920x1080, nous avons dès lors exécuté les tests avec 2 niveaux de qualité différents : extrême et élevée, ce qui inclus d'office un minimum d'antialiasing (soit du MSAA 4x, soit du FXAA/MLAA/AAA). Par rapport aux tests des cartes plus haut de gamme, nous avons revu le niveau de qualité de très élevé à élevé dans les jeux les plus gourmands, de manière à ce que celui-ci corresponde à un mode qui permet de jouer avec un niveau de confort suffisant sur une carte telle que la GTX 660. Nous n'affichons plus les décimales dans les résultats de performances dans les jeux pour rendre les graphiques plus lisibles. Ces décimales sont néanmoins bien notées et prises en compte pour le calcul de l'indice. Si vous êtes observateurs vous remarquerez que c'est également le cas pour la taille des barres dans les graphes. Toutes les Radeon ont été testées avec les pilotes Catalyst 12.8 et toutes les GeForce ont été testées avec les pilotes beta 306.23. Nous avons fait en sorte de tester les GeForce GTX 600 à leurs spécifications minimales garanties au niveau de GPU Boost. Nous avons pour cela joué avec les paramètres d'overclocking pour réduire la fréquence de base, en ajustant légèrement la limite de consommation de manière à ce que la fréquence en pratique corresponde bien à celle d'une carte dont la fréquence turbo maximale serait la fréquence GPU Boost officielle. Insistons bien sur le fait que cela ne revient pas à désactiver GPU Boost ! Pour rappel, nous avions profité du dossier consacré à la GeForce GTX 690 pour faire évoluer notre système de test qui passe sur une plateforme X79 et un Core i7 3960X le but étant de profiter du PCI Express 3.0. Notez à ce sujet que son activation sur les GeForce GTX 600 n'est pas automatique et demande une modification dans la base des registres, ce que nous avons fait et qui donne un gain moyen de 2%. Configuration de testIntel Core i7 3960X (HT désactivé, Turbo 1/2/3/4/6 cores: 4 GHz) Asus P9X79 WS 8 Go DDR3 2133 Corsair Windows 7 64 bits Pilotes GeForce beta 306.23 Catalyst 12.8 Page 10 - Benchmark : Alan Wake Alan Wake Alan Wake est un portage console plutôt bien exécuté et basé sur DirectX 9. Il a la particularité d'imposer l'utilisation du MSAA, nécessaire pour le rendu correct des herbes. Nous utilisons le niveau de qualité Medium proposés par le jeu auxquels nous ajoutons un niveau de qualité maximal qui fait passer le niveau de MSAA à 8x et le niveau de filtrage anisotrope à 16x. Nous effectuons un déplacement bien défini et mesurons les performances avec fraps. Le jeu est maintenu à jour via Steam. Très gourmand en bande passante mémoire avec MSAA 8x dans le mode qualité maximal, Alan Wake y place à égalité les GTX 660 et 660 Ti qui ont à ce niveau des spécifications identiques. Dans les deux modes la GeForce GTX 660 termine cependant ici juste derrière la Radeon HD 7850. Page 11 - Benchmark : Anno 2070 Anno 2070 Anno 2070 reprend une évolution du moteur d'Anno 1404 qui intègre un support de DirectX 11. Nous utilisons d'une part le mode de qualité très élevé proposé par le jeu et d'autre part un mode de qualité maximale qui complexifie les effets de post processing et augmente le niveau de filtrage anisotrope. Nous effectuons un déplacement sur une carte et mesurons les performances avec fraps. Cette fois c'est la puissance de calcul qui compte et la GeForce GTX 660 est nettement derrière la GTX 660 Ti. Elle égale la Radeon HD 7850. Avec le niveau de qualité maximal, le SLI affiche un rendement plus élevé, ce qui permet aux GTX 660 d'égaler les Radeon HD 7870. Page 12 - Benchmark : Batman Arkham City Batman Arkham City Batman Arkham City est mis au point avec une version récente de l'Unreal Engine 3 qui supporte DirectX 11. Bien que ce mode ait souffert d'un gros bug dans la version d'origine du jeu, un patch 1.1 a corrigé cela. Nous utilisons le benchmark intégré. Les performances sont mesurées en mode Extreme (qui inclus les effets DirectX 11 supplémentaires) avec MSAA 4x et MSAA 8x. Le jeu est maintenu à jour via Steam. Les GeForce GTX 600 sont ici plus efficaces avec MSAA 4x, alors que les Radeon HD 7000 profitent de leur bande passante mémoire et de leur taux de compression supérieurs avec MSAA 8x. La GeForce GTX 660 Ti est de toute évidence limitée par sa bande passante mémoire et ne parvient pas à se détacher de la GTX 660. Il semble évident qu'AMD a abandonné le profil CrossFire X pour ce jeu… Page 13 - Benchmark : Battlefield 3 Battlefield 3 Battlefield 3 repose sur le Frosbite 2, probablement le moteur graphique le plus avancé à ce jour. De type rendu différé, il supporte la tessellation et calcule l'éclairage via un compute shader. Nous testons les modes Ultra et High et relevons les performances avec Fraps, sur un parcours bien défini. Le jeu est maintenu à jour via Origin. Les GeForce GTX 600 sont particulièrement efficaces en 1080p dans Battlefield 3. La GTX 660 y égale la Radeon HD 7870, que ce soit seule ou en multi-GPU. Page 14 - Benchmark : Civilization V Civilization V Plutôt réussi visuellement, Civilization V exploite DirectX 11 d'une part pour améliorer la qualité et optimiser les performances du rendu des terrains grâce à la tessellation et d'autre part implémente une compression spéciale des textures grâce aux compute shader, compression qui permet de garder en mémoire les scènes de tous les leaders. Cette seconde utilisation de DirectX 11 ne nous concerne cependant pas ici puisque nous utilisons le benchmark intégré sur une carte de jeu. Nous zoomons légèrement de manière à réduire la limitation CPU qui est très forte dans ce jeu. Tous les détails sont poussés à leur maximum et nous mesurons les performances avec ombres et réflexions. Le jeu est maintenu à jour via Steam. Les GeForce GTX 600 profitent ici des nouveaux pilotes de la série 300 qui apportent un gain significatif, ce qui permet à la GTX 660 de talonner la Radeon HD 7870. Notez que si les GeForce sont généralement mieux positionnées que les Radeon dans ce jeu, ce n'est pas le cas en multi-GPU où CrossFire X est plus efficace. Page 15 - Benchmark : Crysis 2 Crysis 2 Crysis 2 reprend une évolution du moteur de Crysis Warhead optimisée pour être relativement moins gourmande mais y ajoute, via un patch, un support de DirectX 11 dont le coût peut être assez important. C'est par exemple le cas de la tessellation, que nous évitons d'activer compte tenu du fait qu'elle a malheureusement été implémentée en collaboration avec Nvidia d'une manière abusive, dans le but de créer un écart artificiel entre GeForce et Radeon. Nous avions dévoilé cette entourloupe ici. Nous mesurons les performances avec Fraps sur la version 1.9 du jeu. La GeForce GTX 660 est très proche de la Radeon HD 7870 en mode de qualité extrême mais perd un petit peu de terrain en mode ultra. Page 16 - Benchmark : DiRT Showdown DiRT Showdown Dernier né chez Codemaster, DiRT Showdown reprend une évolution légère du moteur DirectX 11 maison. En partenariat avec AMD, les développeurs ont mis en place un éclairage avancé qui prend en compte de nombreuses sources de lumière directes et indirectes pour simuler une illumination globale. Ces options supplémentaires ont été activées avec le premier patch du jeu qui a donc été déployé sur notre système, le jeu étant maintenu à jour via Steam. Pour mesurer les performances, nous poussons toutes les options graphiques à leur maximum et utilisons fraps sur l'outil de test intégré. Si les GeForce GTX 600 égalent leur opposante directe du côté des Radeon HD 7000 en 1080p sans l'éclairage avancé, une fois celui-ci activé leurs performances plongent. Nvidia n'a pas eu accès à ce patch suffisamment tôt que pour pouvoir proposer des optimisations spécifiques à l'avance et ne semble pas pressé d'y remédier. Le profil SLI est également particulièrement peu efficace. Page 17 - Benchmark : Max Payne 3 Max Payne 3 Max Payne 3 présente un rendu globalement réussi, bien qu'inégal par endroit, notamment à cause de textures de "qualité console". Il repose sur un moteur DirectX 11 au rendu différé qui supporte plusieurs effets avancés tels que le HDAO ou la tessellation, qui est plutôt lourde une fois poussée au maximum. Il supporte le FXAA mais également le MSAA, très lourd compte tenu du type de rendu. Ce dernier reste nécessaire pour venir à bout de l'aliasing, le FXAA n'étant pas suffisant. Nous avons poussé toutes les options à leur maximum et utilisé Fraps sur un parcours bien défini. Le jeu est maintenu à jour via Steam. Les GeForce GTX 600 sont particulièrement à l'aise dans ce jeu, pour lequel Nvidia a travaillé en amont avec les développeurs et le niveau de tessellation maximal est très lourd, ce qui freine quelque peu les Radeon. Elles reviennent cependant dans la course quand le MSAA 4x est activé. La GeForce GTX 660 est ainsi au niveau de la Radeon HD 7870 sans MSAA 4x, mais légèrement derrière avec ce filtre. Page 18 - Benchmark : Sleeping Dogs Sleeping Dogs Sleeping Dogs nous propose un environnement hongkongais qui peut s'avérer être très gourmand pour nos cartes graphiques dès que les options de son moteur DirectX 11 sont poussées à leur maximum. Nous utilisons le benchmark intégré au jeu, ce dernier étant maintenu à jour via Steam et donc en version 1.5 pour ce test. Le pack de texture HD a bien entendu été installé. Les niveaux de qualité élevé et extrême sont utilisés, et se démarquent notamment par le niveau de SSAA (supersampling antialiasing) exploité conjointement avec le FXAA : respectivement 2x et 4x. L'aliasing géométrique est très important dans ce jeu, ce qui rend l'utilisation d'un antialiasing avancé particulièrement nécessaire. Si les résultats sont plutôt équilibrés en mode de qualité élevée, en mode extrême les Radeon ont l'avantage. La GeForce GTX 660 devance ainsi la Radeon HD 7850 dans le premier mais termine derrière dans le second. Page 19 - Benchmark : The Witcher 2 Enhanced Edition The Witcher 2 Enhanced Edition The Witcher 2 est un jeu dont le moteur graphique a été peaufiné progressivement, pour en arriver à la récente Enhanced Edition. Bien que basé sur DirectX 9, il est relativement gourmand une fois toutes ses options graphiques poussées au maximum, l'une d'elles étant particulièrement gourmande : l'UberSampling. Il s'agit en réalité d'un antialiasing de type supersampling 4x avec quelques optimisations. Nous avons testé le jeu en qualité élevée et ultra, cette dernière activant l'Ubersampling. Les performances sont mesurées avec Fraps. Les Radeon HD 7000 dominent assez facilement dans ce jeu en qualité ultra, mais les résultats sont plus équilibrés en qualité élevée où la GTX 660 peine cependant à dépasser la Radeon HD 7850. Page 20 - Benchmark : Total War Shogun 2 Total War Shogun 2 Total War Shogun 2 a reçu un patch DirectX 11, développé en collaboration avec AMD. Il apporte entre autre un support de la tessellation et un effet de profondeur de champ de meilleure qualité. Nous l'avons testé en mode DirectX 11, avec une qualité maximale, du MSAA 4x et du MLAA. Le jeu est maintenu à jour via Steam. Une fois n'est pas coutume, c'est Nvidia qui domine quand le MSAA 4x est activé. La GeForce GTX 660 devance alors facilement la Radeon HD 7870, mais avec MLAA le positionnement est inversé. Page 21 - Récapitulatif des performances RécapitulatifBien que les résultats de chaque jeu aient tous un intérêt, nous avons calculé un indice de performances en nous basant sur l'ensemble de résultats et en attachant une importance particulière à donner le même poids à chacun des jeux. Nous avons également calculé des sous-indices basés sur le niveau de qualité de manière à mettre en évidence une éventuelle petite différence de comportement entre les Radeon et les GeForce. Nous avons attribué un indice de 100 à la Radeon HD 7870 :
La GeForce GTX 660 vient prendre place entre les Radeon HD 7850 et HD 7870 dans notre indice, un peu plus proche de la première en qualité extrême, et un peu plus proche de la seconde en qualité élevée. Ce comportement se retrouve plus ou moins marqué sur toutes les GeForce GTX 600 : elles souffrent plus que les Radeon HD 7000 lorsque la qualité graphique grimpe, particulièrement lorsque cela inclus un antialiasing de type multisample. Par rapport à la GeForce GTX 460, pour laquelle une upgrade sera envisagée par de plus en plus d'utilisateurs, la GeForce GTX 660 apporte un gain sympathique de 68%. La capacité de GPU Boost d'aller au-delà de sa fréquence officielle a peu d'impact pour la GeForce GTX 660 dont la limite de consommation est relativement stricte, ce qui l'empêche de profiter de sa fréquence maximale dans la plupart des jeux. Le gain se limite ainsi à 1%, alors que l'on gagne 4%, 5% et 2% sur nos cartes GeForce GTX 660 Ti, 670 et 680 lorsqu'elles ne sont pas limitées à la fréquence de GPU Boost officielle de Nvidia comme c'est le cas ici. Ce sont également les Radeon HD 7870 en CrossFire X qui l'emportent face aux GeForce GTX 660 en SLI, avec une petite avance de 8%, limitée par un problème persistant des pilotes AMD dans Batman Arkham City. En dehors de ce cas, le scaling est plutôt bon des deux côtés. Page 22 - Performances DirectCU II TOP et overclocking GTX 660 Asus DirectCU II TOP, overclocking, GPU BoostComme nous l'avons constaté dans l'indice de performances, la possibilité de GPU Boost de dépasser la fréquence officielle, 1032 MHz, a un impact très faible sur la GeForce GTX 660. Cela s'explique par une limite de consommation plus stricte sur sur les autres cartes et qui empêche le GPU de rester à une fréquence maximale dans la majorité des jeux. Voici les fréquences approximativement observées sur la carte de référence selon les jeux : Alan Wake : 1045-1058 MHz Anno 2070 : 1006 MHz Batman Arkham City : 993-1032 MHz Battlefield 3 : 1045-1058 MHz Civilization V : 1019 MHz Crysis 2 : 1006-1071 MHz DiRT Showdown : 1058-1084 MHz Max Payne 3 : 1033-1071 MHz Sleeping Dogs : 1032-1045 MHz The Witcher 2 Enhanced Edition : 1058-1084 MHz Total War Shogun 2 : 1019-1045 MHz Au niveau de l'overclocking, la carte de référence a accepté de monter de +100 MHz pour le GPU et de +225 MHz pour la mémoire, pour des fréquences GPU/Boost maximal/mémoire qui passent de 980/1097/1502 à 1084/1201/1615. Du côté de l'Asus DirectCU II TOP, nous avons pu monter à +50 MHz pour le GPU et +200 MHz pour la mémoire, ce qui fait passer les fréquences de 1071/1175/1527 MHz à 1123/1227/1627 MHz. Pour observer les performances, nous avons bien entendu poussé la limite de consommation à son maximum : +10% soit 127W pour la GTX 660 de référence et 143W pour le modèle TOP d'Asus.
La GTX 660 DirectCU II TOP d'Asus se montre 10% plus performante que la GTX 660 de référence, de quoi se rapprocher de la GTX 660 Ti de référence, qui ne conserve qu'un petit avantage de 5%, réduit à néant lorsque le niveau de MSAA est élevé. L'overclocking de la GTX 660 de référence permet de gagner 10% de performances, alors que la carte DirectCU II TOP, déjà overclockée d'usine, ne gagne que 5%. Page 23 - Upgrade : face aux anciennes générations Upgrade : face aux anciennes générationsTrès souvent lors d'un lancement de carte graphique, Nvidia essaye d'orienter sa communication autour de l'upgrade d'un ancien modèle particulier. Une façon de déplacer le débat de l'opposition directe face aux Radeon concurrentes, ces derniers temps défavorable aux GeForce dont le rapport performances/prix est moins élevé, mais aussi d'essayer de montrer l'interêt de l'upgrade alors que les cycles de renouvellement ont tendance à se rallonger. Pour ce lancement c'est autour de la 9800 GT de devenir le concurrent designé à l'upgrade. Pour éviter l'ignorance totale dans laquelle se retrouve en général cette tentative d'orienter les tests, Nvidia a posé une condition lors de l'envoi de l'échantillon de référence : la GeForce 9800 GT devrait prendre place dans le test. Si nous n'aimons guère ce genre de pression sur l'organisation de nos dossiers, il est vrai qu'il est dommage que la question de la mise à jour de cartes d'anciennes générations ne soit souvent traitée qu'indirectement, le temps disponible pour les tests ne permettant pas de revenir sur de nombreuses cartes. Avec plusieurs reports successifs de la date de sortie de la GeForce GTX 660, nous disposions cependant pour une fois de quelques jours de plus. Nous avons donc accepté la condition posée par Nvidia mais ne nous sommes bien entendu pas focalisés sur la 9800 GT. Nous avons ressorti un panel plus large de cartes représentatives de la génération DirectX 10 et des premiers modèles DirectX 11. Voici ce que cela donne dans quelques jeux, de quoi vous permettre d'évaluer le gain que pourrait vous apporter dans les jeux récents la mise à jour de votre carte graphique. Notez que pour ce test, nous avons utilisé les pilotes 306.23 du côté des GeForce alors que les Radeon HD 4000 ont été testées avec les Catalyst 12.6, les derniers à les supporter. Les autres Radeons ont été testées avec les Catalyst 12.11beta. Nous avons mis à jour les résultats des GeForce 600 sous Battlefield 3 avec les pilotes 310.61beta (ils ne changent pas les performances sur les anciennes générations de GPU).
Page 24 - Conclusion ConclusionA l'issue de ce dossier, nous retrouvons une conclusion habituelle : le rapport performances/prix des GeForce a du mal à égaler celui des Radeon. Nvidia profite ici de son image de marque mieux répandue chez les joueurs et se justifie par quelques options supplémentaires dans ses pilotes, et qui peuvent être très utiles, telles que la synchronisation verticale adaptative ou encore l'accélération de PhysX dans certains jeux. Avec la GeForce GTX 660, c'est la Radeon HD 7850 que vise Nvidia… mais avec le prix de la Radeon HD 7870, tout du moins sur les premier prix. Certes elle l'emporte sur la première mais reste une dizaine de points derrière la seconde, ce qui la place dans le positionnement délicat de nombreuses GeForce. Nul doute cependant que la GeForce GTX 660 trouvera son public à ce tarif de 230€, ne serait-ce que grâce à l'image de marque de Nvidia et surtout de ses pilotes. On notera également que la situation est plus favorable à la GTX 660 sur les cartes personnalisées des constructeurs, nous reviendront sur ce point ci-après. Si le GPU GK106 ne parvient pas à battre le GPU Pitcairn d'AMD, il s'en sort cependant relativement bien mais il aurait malgré tout probablement pu être plus compétitif si Nvidia s'était contenté de l'associer à une mémoire symétrique de 1.5 Go pour réduire quelque peu le prix sans nuire aux performances en pratique, un choix qu'il aurait malheureusement été difficile à faire passer d'un point de vue marketing. L'arrivée d'un GPU Nvidia 28nm, 6 mois après le lancement de la GeForce GTX 680, dans ce segment tarifaire reste bien entendu une excellente nouvelle qui devrait participer à faire bouger les lignes, comme l'a montré il y a peu le réajustement des tarifs chez AMD : esperons que les deux constructeurs continueront sur cette voie ! La comparaison directe avec plusieurs cartes à succès de la génération DirectX 10 montre l'écart devenu très important avec les modèles de la génération actuelle. Les mettre à jour par un modèle tel que la GTX 660 ou tel qu'une Radeon HD 7800 fera une différence conséquente, permettant de jouer en 1080p dans les jeux récents avec un bon niveau de qualité et de fluidité. Il était également intéressant d'observer le comportement de ces cartes en multi-GPU, un couple de Radeon HD 7870 ou de GeForce GTX 660 affichant un tarif proche de celui des GTX 680 et des Radeon HD 7970. Ces système bi-cartes l'emportent sur les gros GPU, mais au prix des inconvénients de la technologie qui font que nous préférons malgré cela donner notre préférence à ceux-ci. Terminons par un mot sur les modèles personnalisés, tout d'abord avec la GTX 660 DirectCU II TOP d'Asus. Une fois de plus Asus démontre l'excellente efficacité de son système de refroidissement DirectCU II. Après quelques hésitations sur le format et la structure, le fabricant semble dorénavant tenir la bonne formule et nous ne pouvons que nous en réjouir. Ici aussi les tests se suivent et se ressemblent et nous devons cependant tempérer ce très bon résultat au niveau des températures et des nuisances sonores par le prix élevé pratiqué par Asus. Par ailleurs quelques petits points pourraient être améliorés au niveau du design tels qu'un accès plus dégagé au connecteur d'alimentation PCI Express, ou encore l'ajout d'un deuxième connecteur de ce type pour soulager la source 12V fournie par la carte-mère, d'autant plus lorsqu'il s'agit d'un modèle TOP overclocké d'usine et voué à être poussé encore plus loin. Enfin il est important de remarquer que contrairement aux cartes premiers prix, les modèles personnalisés de GTX 660 chez certains partenaires sont moins chers que leur équivalent en Radeon HD 7870 et sont donc à l'intérieur de ces gammes tout aussi compétitifs. Il sera intéressant d'observer l'évolution de ces prix dans les semaines à venir, la baisse opérée par AMD sur les Radeon HD 7870 n'étant pas encore complètement intégrée chez tous les partenaires alors que le tarif de la GTX 660 est voué à se tasser quelque peu. Copyright © 1997-2024 HardWare.fr. Tous droits réservés. |