Emanuel Laguna 13 anos atrás
Após meses de muita especulação, chegam ao varejo as primeiras placas de vídeo equipadas com o processador gráfico dedicado GeForce GTX 465.
Tal GPU dedicada será o mais barato chip baseado na microarquitetura Gráficos Fermi 100, pelo menos enquanto aguardamos as placas de vídeo baseadas nos chips GF104, GF106 e GF108 da nVidia.
O processador gráfico GeForce GTX 465 será baseado no chip GF102, onde teríamos um GPC e um outro SM adicional desativados, quando comparamos tal chip ao projeto original do Fermi.
É um belo ‘sacrifício’, em nome do reaproveitamento de chips defeituosos (do GF100 original) e conseqüente desconto nos precinhos “camaradas” das respectivas placas de vídeo, estas por volta dos 279 dólares no Ocidente (ou € 279,00 no velho continente).
Apenas para termos idéia do que tal perda representaria no ponto de vista do desempenho, relembremos o seguinte:
Cada Cluster de Processamento Gráfico (GPC) do Fermi possui 4 unidades de Múltiplo Processamento em Fluxo Gráfico (SM) e é associado diretamente a no máximo um canal e meio de memória (interface de 96 bits). Por sua vez, cada SM possui 32 CUDA cores (ALUs), 4 texturizadores (TMUs) e 3 rasterizadores (ROPs).
Na microarquitetura Fermi, os 4 TMUs formam, em conjunto com uma unidade tesseladora, o chamado motor polimórfico (PE), responsável por toda a geometria executada via hardware em cada SM. Algo análogo ocorre com o motor de rasterização (RE), também presente em cada SM e que engloba os 3 ROPs do SM.
Resumindo: o Fermi original possui 4 GPCs e 16 SMs, o que, em teoria, nos daria um processador gráfico dedicado ao DirectX 11 com 512 ALUs, 64 TMUs, 48 ROPs e interface de memória 384 bits. Na prática, temos os dados abaixo para a GeForce GTX 465:
Certo, tio Laguna, e quem seriam os concorrentes diretos de todos esses números na figura acima?
Vamos à mais alguns números interessantes, agora de 2 placas de vídeo, diretamente concorrentes, ou seja, que tenham preços próximos à GeForce GTX 465. Tais placas têm chips baseados no Cypress, a GPU high-end da família Evergreen, toda uma série de processadores gráficos da ATi, dedicados ao DirectX 11:
Agora traduziremos toda essa infinidade de números para as aplicações reais deles, que são a renderização, manipulação, aceleração e posterior exibição de gráficos tridimensionais em tempo real. Como? Por meio de diversos benchmarks e outras comparações de desempenho.
Vejamos abaixo o que a GeForce GTX 465 faria com o DiRT 2, um jogo desenvolvido em DX11:
No benchmark realizado pelo Tom’s Hardware, o desempenho da GeForce GTX 465 é discretamente inferior ao da Radeon HD 5830, esta trinta obaminhas mais barata, quando se é exigida uma resolução maior (1080p versus 2560x1600), embora o desempenho de ambas esteja bem próximo, ao desativar o anti-aliasing a 8 amostras, na resolução mais alta do teste.
Observemos atentamente a situação a seguir, onde temos uma mesma resolução testada (1920x1200) em dois jogos diferentes, Aliens Versus Predator (DX11) e Resident Evil 5 (DX10):
Agora sim vemos que os US$30 adicionais pela GeForce GTX 465 fizeram uma boa diferença, pois vemos que a barata Radeon HD 5830 foi entre 20 a 33 por cento “menos rápida” no Aliens Versus Predator, enquanto a diferença no Resident Evil 5 não ultrapassou os 8% à favor da nova criança da nVidia, que conseguiu maior quantidade de fotogramas por segundo.
O que podemos aproveitar desses testes todos, tio Laguna?
Bom, notamos aqui, primeiramente, o quanto a microarquitetura Fermi pode ser ‘modularizável’, ou seja, a capacidade de reaproveitar chips incompletos para preencher lacunas de desempenho e preço mais modestos, mantendo a competitividade da nVidia no mercado de processadores gráficos com novos chips, algo que a empresa não conseguiu com a segunda geração dos gráficos Tesla.
Outro aspecto que podemos perceber: enquanto a GeForce GTX 465 ainda é o terceiro processador gráfico DX11 da nVidia (com um preço relativamente baixo, mas ainda high-end), a AMD+ATi já disponibilizou a família Evergreen por completo (o que compreende dez faixas de preço e desempenho!) e isso nem inclui cinco produtos destinados ao segmento profissional.
O tio Laguna particularmente admira a microarquitetura Fermi, até muito mais que a Evergreen, mesmo sendo fã dos processadores gráficos da ATi há exatos 8 anos.
E por um motivo simples: o tio Laguna considera a microarquitetura Fermi como inovadora, estando à frente de seu tempo. Inclusive, o Fermi até relembra a empolgação que ele teve com o R600.
O único e maior defeito da nVidia é depender do processo de litografia à 40nm da TSMC, cujos wafers de silício ainda apresentam baixo yield, o que faz com que o enorme chip do Fermi (530mm²!) não renda o desempenho esperado.
O gozado é perceber que tal situação é análoga ao R600: àquela época, logo após a fusão AMD+ATi, a empresa apresentou um enorme chip (OMG, chegava a ter 420mm²!) litografado à 80nm, cuja placa era caríssima para ser fabricada, afinal tinha oito canais de memória (interface de 512 bits), o que representava 1024 pinos/fios apenas para a entrada e saída de dados no framebuffer!
Além de cara, a Radeon HD 2900 XT simplesmente não entregou o desempenho prometido à época, afinal a ATi foi responsável pelo mais potente processador gráfico dos consoles de sétima geração, o Xenos, pertencente ao XBox 360. Tal GPU dedicada foi o primeiro projeto de fluxo gráfico unificado, mesmo tendo sua API gráfica ainda um tanto limitada ao DirectX 9c.
Apesar do fracasso inicial, a microarquitetura do R600 continua bem viva no Evergreen, pois após três séries de GPUs com refinamentos e outras sutis melhorias, o Cypress apenas representa o ‘estado da arte’ do R600, ou seja, chegou ao que o tio Laguna considera o limite máximo de desempenho.
Ou a AMD+ATi apresenta, de facto, uma nova arquitetura, ou o desempenho não será competitivo caso a nVidia se recupere do “passo maior que as pernas” com o Fermi.
O que você faria nessa situação toda?
Enquanto isso, o tio Laguna ficará verde, de inveja, por não poder experimentar algo melhor que a veterana Sapphire Radeon HD 3850. Pelo menos não tão cedo.
*Observo que alguns termos mais complicados possuem legendas ocultas, visíveis ao passar o cursor do mouse sobre tais palavras.