Meio Bit » Arquivo » Games » Sobre o “bug” da GeForce GTX 970, a nVidia explica que a GPU trabalha de forma diferente

Sobre o “bug” da GeForce GTX 970, a nVidia explica que a GPU trabalha de forma diferente

nVidia esclarece dúvidas sobre o funcionamento das placas de vídeo com a GeForce GTX 970. Tais placas possuem de fato 4 GB de VRAM, mas o acesso é feito de forma diferente de outras placas.

9 anos atrás

Laguna_GeForce_GTX_970

Placa de vídeo da Asus sem o conjunto de arrefecimento (crédito: Tech Report)

No final da semana passada, alguns consumidores que compraram placas de vídeo com o processador gráfico GeForce GTX 970, placas essas baseadas no modelo de referência, notaram comportamento anormal quando um jogo ou outro aplicativo exigia os 4 GB de VRAM. Era como se tais placas de vídeo, embora todas construídas com os habituais 16 chips de 2 Gb do tipo GDDR5, só tivessem acesso pleno a 14 deles (28 gigabits ou 3,5 GB).

Em entrevista, o vice-presidente sênior de engenharia dos processadores gráficos da empresa respondeu o seguinte:

Houve um erro no guia oficial para reviews, por falha de comunicação entre o setor de engenharia e o setor de relações públicas (responsável pelo marketing) sobre como a arquitetura da versão GTX 970 do chip GM204 funcionava de fato.” — Jonah Alben, da nVidia.

Ficou parecendo que a nVidia foi a público assumir que limitou o desempenho da GTX 970, sendo que tinha vendido com especificações melhores mas talvez não tenha sido esse o caso. O desenho abaixo explica melhor a delicada situação:

Laguna_GM204_GTX_970

Diagrama da GeForce GTX 970 (crédito: Tech Report)

Podemos ver que embora anunciada erroneamente como tendo 2 MB de memória cache L2 e os mesmos 64 ROPs da GeForce GTX 980 (esta é o chip GM204 completo), a GeForce GTX 970 na verdade tem 1,75 MB (ou 1.792 kB) de memória cache L2 e “apenas” 56 ROPs, com o restante das especificações inalteradas. E tal processador gráfico acessa sim 4 GB de memória dedicada de vídeo (VRAM), mas de forma digamos… diferente de qualquer outro já feito.

São sim 4 GB de memória do tipo GDDR5, mas particionada em dois blocos: um com 3,5 GB cuja taxa de transferência bruta é de 196 GB/s (224 bits) e outro pedaço de 512 MB (0,5 GB) acessado a 28 GB/s (32 bits). Combinando os dois blocos, temos os prometidos 224 GB/s (a 256 bits).

O problema é que na prática, os jogos e, principalmente, os drivers da nVidia teriam que ser otimizados para limitar o processador gráfico GTX 970 a utilizar apenas os 3,5 GB de VRAM iniciais; deixando assim os 512 MB restantes para tarefas que não exijam grande transferência bruta de dados, como descompressão de texturas em tempo real. Do jeito que está, sem qualquer otimização, ao acessar o bloco mais lento o desempenho geral cai mesmo.

Imagine que os últimos 6 ou 8 frames de um segundo de vídeo renderizado em 4K estejam no 0,5 GB mais lento. Quando eles forem exibidos em tela, estariam atrasados em relação aos demais, provavelmente no segundo posterior ao qual ele faria parte. Para compensar, a taxa de atualização desejada (60 fps) cairia junto para evitar falta de sincronia ainda maior. Mesmo que os 28 GB/s sejam mais rápidos que puxar parte da memória principal (RAM) via PCI Express, não fazer parte do bloco principal de memória aumenta a latência pois o bloco menor não é prioritário.

Num tópico lá no fórum oficial da GeForce, aparentemente houve uma resposta supostamente oficial da nVidia que dizia trazer algum patch específico para resolver o problema da GTX 970. Só que por meio do Twitter a empresa negou que fará qualquer atualização mais específica de seus drivers.

Traduzindo:

Qualquer atualização futura afetará todas as placas de vídeo com nossas GPUs.

Um pena. Mesmo que somente tivesse 3,5 GB de VRAM, uma placa de vídeo com a GeForce GTX 970 continua sendo uma ótima compra. Aliás, kibando e alterando uma analogia automotiva:

Você compra um belo muscle car, um Dodge Charger Hellcat 2015. Na propaganda temos 8 cilindros num motor de 6,2 L com 24 válvulas que produz 707 hp a 6.000 RPM. É um dos carros mais poderosos que você pode comprar, fazendo de 0 a 100 km/h em menos de 3 s percorrendo os 400 m iniciais em 12 segundos.

Laguna_Dodge_Charger_SRT_Hellcat

Depois que você o compra por mais de 60 mil dólares (ou uns R$ 600 mil), descobre que as 24 válvulas só funcionam abaixo de 90 km/h para economizar combustível. Metade, ou seja, 12 das 24 válvulas deixam de funcionar acima disso também por causa da inércia.

Menos válvulas, maior desempenho. Mais válvulas, menor consumo. Não dá para ter os dois. O fictício carro da analogia ainda continua fazendo 707 hp a seis mil rotações por minuto, mas infelizmente você não pode se gabar de ter comprado um legítimo V8 de 6,2 L com 24 válvulas.

Enfim, bom lembrar que o problema não afeta placas com o recente lançamento da nVidia, a GeForce GTX 960. De qualquer forma, a rival AMD foi vista dando uma festa e soltando rojões. Sabe-se lá por qual motivo.

Laguna_AMD_Radeon_R9_290_ad

Agradeço ao Ronaldo e ao Leonardo pela sugestão de pauta. E ao Alexandre pelas correções na analogia. A presente matéria saiu atrasada por eu ter concentrado meus esforços nesta outra.

relacionados


Comentários