Haswell et mémoire DDR3
Publié le 15/10/2013 par Guillaume Louel
Le lancement d'une nouvelle micro architecture - un "tock" en langage Intel - est toujours un petit événement pour le monde du matériel. Pour ses processeurs Haswell, connus commercialement sous le nom de processeurs Core de 4eme génération, Intel a apporté des changements à tous les étages, dont certains concernent plus particulièrement la manière dont ces processeurs interagissent avec la mémoire. L'occasion de voir comment se comporte cette nouvelle génération avec différents kits de RAM allant du plus classique aux plus onéreux.
Ce n'est pas la première fois que nous nous intéressons au sujet de l'adéquation entre mémoire et processeur. Lors de nos articles précédents, nous avions noté que la question de la latence, si elle jouait toujours un rôle, passait au second plan. Exprimée en cycles dans les caractéristiques des produits (on lira par exemple DDR3-1600 CL9, ou encore DDR3-1600 9-9-9), la CAS latency indique le nombre de cycles d'horloges nécessaire à un module pour accéder à des données. Historiquement, la latence à toujours eu un rôle important même s'il a eu tendance à s'amenuiser avec le temps. Nous avions vus en pratique que la bande passante (1600, 2133, etc…) primait au final sur la latence sur les architectures processeurs modernes.
Pas de miracle derrière ce fait : avec l'intégration du contrôleur mémoire directement dans le processeur (ils étaient autrefois placés dans le chipset), les fabricants de processeurs peuvent optimiser finement ce que l'on appelle le sous système mémoire. Les puces modernes intègrent en effet différents niveaux de caches de tailles et rapidités différentes qui viennent s'intercaler entre les unités d'exécution et la mémoire. Des systèmes complexes de prédiction et de prefetching tentent d'anticiper au maximum les lectures mémoires afin d'éviter à tout prix que le processeur doive attendre après les données.
Ces mécanismes sont de plus en plus efficaces d'une architecture sur l'autre et Intel a effectué avec l'architecture d'Haswell un certain nombre de changements qui devraient avoir un impact. On pense par exemple à la bande passante des caches doublées, ou encore à l'ajout dans les unités d'execution d'un port supplémentaire dédié aux écritures mémoires. Nous verrons en pratique si cela à bel et bien un impact.
Nous avions également noté un point pratique en ce qui concerne l'utilisation de mémoire haut de gamme avec les cartes mères Ivy Bridge : difficile de dépasser la DDR3-2400 sur une carte mère milieu de gamme. Nous avions du utiliser pour notre test précédent une carte mère Maximus V Formula d'Asus. Pour Haswell, nous avons noté un progrès net puisque nous n'avons pas rencontré de problème avec les cartes, y compris entrée de gamme, pour booter avec un kit mémoire DDR3-2800.
Pour réaliser nos tests, nous avons utilisé la configuration suivante :
- Processeur Intel Core i7-4770K (cadencé à 4.3 GHz)
- Carte mère Gigabyte GA-Z87X-D3H
- Kits mémoire Corsair CMD8GX3M2A2666C11 et CMD8GX3M2A2800C12
- Carte graphique GeForce GTX 780
Nous réutilisons ici les kits mémoires Corsair que nous avions détaillés précédemment dans cet article. Afin de stresser au maximum les kits, nous overclockons également notre processeur à 4.3 GHz.
Notez que nous ne reviendrons pas sur la question de l'affinité de l'IGP, nous avions déjà noté dans cet article des gains importants dans des jeux comme F1 2011 par exemple. L'utilisation de mémoire très haut de gamme, fort onéreuse, avec un IGP reste un cas qui ne fait pas vraiment sens au-delà des tests théoriques quand l'on peut s'offrir, pour le prix d'un de ces kits, une carte graphique dédiée !
Ce n'est pas la première fois que nous nous intéressons au sujet de l'adéquation entre mémoire et processeur. Lors de nos articles précédents, nous avions noté que la question de la latence, si elle jouait toujours un rôle, passait au second plan. Exprimée en cycles dans les caractéristiques des produits (on lira par exemple DDR3-1600 CL9, ou encore DDR3-1600 9-9-9), la CAS latency indique le nombre de cycles d'horloges nécessaire à un module pour accéder à des données. Historiquement, la latence à toujours eu un rôle important même s'il a eu tendance à s'amenuiser avec le temps. Nous avions vus en pratique que la bande passante (1600, 2133, etc…) primait au final sur la latence sur les architectures processeurs modernes.
Pas de miracle derrière ce fait : avec l'intégration du contrôleur mémoire directement dans le processeur (ils étaient autrefois placés dans le chipset), les fabricants de processeurs peuvent optimiser finement ce que l'on appelle le sous système mémoire. Les puces modernes intègrent en effet différents niveaux de caches de tailles et rapidités différentes qui viennent s'intercaler entre les unités d'exécution et la mémoire. Des systèmes complexes de prédiction et de prefetching tentent d'anticiper au maximum les lectures mémoires afin d'éviter à tout prix que le processeur doive attendre après les données.
Ces mécanismes sont de plus en plus efficaces d'une architecture sur l'autre et Intel a effectué avec l'architecture d'Haswell un certain nombre de changements qui devraient avoir un impact. On pense par exemple à la bande passante des caches doublées, ou encore à l'ajout dans les unités d'execution d'un port supplémentaire dédié aux écritures mémoires. Nous verrons en pratique si cela à bel et bien un impact.
Nous avions également noté un point pratique en ce qui concerne l'utilisation de mémoire haut de gamme avec les cartes mères Ivy Bridge : difficile de dépasser la DDR3-2400 sur une carte mère milieu de gamme. Nous avions du utiliser pour notre test précédent une carte mère Maximus V Formula d'Asus. Pour Haswell, nous avons noté un progrès net puisque nous n'avons pas rencontré de problème avec les cartes, y compris entrée de gamme, pour booter avec un kit mémoire DDR3-2800.
Configuration de test
Pour réaliser nos tests, nous avons utilisé la configuration suivante :
- Processeur Intel Core i7-4770K (cadencé à 4.3 GHz)
- Carte mère Gigabyte GA-Z87X-D3H
- Kits mémoire Corsair CMD8GX3M2A2666C11 et CMD8GX3M2A2800C12
- Carte graphique GeForce GTX 780
Nous réutilisons ici les kits mémoires Corsair que nous avions détaillés précédemment dans cet article. Afin de stresser au maximum les kits, nous overclockons également notre processeur à 4.3 GHz.
Notez que nous ne reviendrons pas sur la question de l'affinité de l'IGP, nous avions déjà noté dans cet article des gains importants dans des jeux comme F1 2011 par exemple. L'utilisation de mémoire très haut de gamme, fort onéreuse, avec un IGP reste un cas qui ne fait pas vraiment sens au-delà des tests théoriques quand l'on peut s'offrir, pour le prix d'un de ces kits, une carte graphique dédiée !
Latence et bande passante mémoire
Sommaire
Vos réactions
Contenus relatifs
- [+] 07/02: Windows 10, Meltdown et Spectre : q...
- [+] 07/07: Core i5-5675C : Broadwell côté CPU ...
- [+] 02/06: Intel lance les Broadwell-H 4 coeur...
- [+] 26/03: Nouveaux Pentium et Core i3 Haswell...
- [+] 05/03: Broadwell-K LGA 1150 confirmé pour ...
- [+] 01/02: Skylake-K en LGA dès le troisième t...
- [+] 01/10: Perfs avec 2, 4, 6 et 8 cœurs : 4 j...
- [+] 29/08: Intel Haswell-E, LGA 2011-v3 et DDR...
- [+] 12/08: Intel désactive TSX suite à un bug
- [+] 07/08: 5 nouvelles Z97 chez ASRock