Corra nVidia, corra! “Tira logo esse atraso”, pois as Radeon HD 6000 vêm aí

Após quase três anos de bons serviços na fatia popular do mercado de processadores gráficos DirectX 10 para desktops, parece que a nVidia finalmente “aposentará” as GPUs derivadas do G92.

Laguna_nVidia_Logo_27set2010

Um motivo é a GeForce GTS 450, que representa o 5º lançamento desktop em GPUs DirectX 11 da camaleão verde de Santa Clara: tal processador gráfico dedicado será o principal componente de placas de vídeo na faixa dos 130 dólares, basicamente a metade do preço de uma placa de vídeo com a GeForce GTX 465 e pouco mais de um quarto do investimento para conseguir outra placa com a GeForce GTX 480.

Outro detalhe que faz tal GPU ser um lançamento digno de nota: a GeForce GTS 450 é diretamente derivada da GF106. Só que esta e a GF104 (GeForce GTX 460) têm uma coisa em comum: ambos os processadores gráficos foram redesenhados em relação ao chip Gráficos Fermi 100 original.

O plano inicial da nVidia era que o GF104 e o GF106 fossem, respectivamente, a metade e o quarto da capacidade do projeto original do Fermi. O porém foi a “incontestável liderança” das GeForce GTX 480 e 470 nos quesitos temperatura e consumo, facto que obrigou a nVidia a modificar bastante os chips sucessores, até para melhorar o desempenho ante a concorrência direta contra a AMD+ATi.

E a principal modificação foi logo no interior do módulo constituinte de tais chips, a unidade de Múltiplo Processamento em Fluxo Gráfico (SM):

Laguna_nVidiaGF1046_27set2010

A versão completa do Fermi (GF100) seria composta por 4 Clusters de Processamento Gráfico (GPC), ou seja, 16 unidades de Múltiplo Processamento em Fluxo Gráfico (SMs), o que, em teoria, nos daria um processador gráfico dedicado ao DirectX 11 com 512 CUDA Cores (ALUs), 64 TMUs, 48 ROPs e interface de memória 384 bits.

Laguna_GTX460_specs_27set2010

Até o momento, nenhum dos processadores gráficos DX11 já lançados pela camaleão verde é composto pela versão completa do GF100.

E há uma boa justificativa para isso: a nVidia dependia do processo de litografia à 40 nm da TSMC, cujos wafers de silício apresentavam baixo yield, o que fez com que o enorme chip original do Fermi (530mm² ante os 334mm² do Cypress XT/Radeon HD 5870 diretamente concorrente) não rendesse o desempenho esperado.

Com isso, a GeForce GTX 480 é composta por 15 dos 16 SMs do Fermi original à freqüência 700 MHz, enquanto a GTX 470 possui 14 deles a 607 MHz e a GeForce GTX 465, tem 11 SMs funcionais (607 MHz).

Com a modificação nos SMs, a nVidia obteve o tal chip GF104, composto por 2 GPCs redesenhados, o que corresponde a 8 SMs estruturalmente modificados.

Um chip GF104 completo e inalterado (aproximadamente 2 bilhões de transístores, numa área de 370 mm²) seria então lançado no mercado sendo constituído por 384 CUDA Cores (ALUs), 64 TMUs, 32 ROPs e interface de memória 256 bits.

Em termos de processamento gráfico bruto, o tio Laguna especula que o GF104 teria entre dois terços a três quartos da capacidade original do GF100.

Só para termos idéia do que estamos a tratar, a GeForce GTX 460 (7 dos 8 novos SMs, a 675 MHz), uma GPU diretamente derivada do GF104, conseguiu desempenho melhor que a GeForce GTX 465.

E o que nos chama mais a atenção, ao compararmos a GeForce GTX 465 com a GeForce GTX 460, é o precinho camarada das respectivas placas. A veterana GeForce GTX 465 equipava placas de vídeo na faixa dos 280 dólares, enquanto as placas com a GeForce GTX 460 possuem duas faixas de preços distintas:

  • US$ 200 para a versão com 24 ROPs e interface de memória 192 bits (768 MiB);
  • US$ 230 para a versão com 32 ROPs e interface de memória 256 bits (1 GiB).

Como os chips de memória de ambas as GeForce GTX 460 operam a 900 MHz, um dos critérios de desempate entre o desempenho de ambas poderia ser a taxa de transferência da memória: a versão de 200 obamas possui tal quesito 25 % menor (80,5 GiB/s contra 107,3 GiB/s).

O tio Laguna nem leva tal critério ‘tão à sério’ na compra de uma placa de vídeo nova, mas se por 30 dólares a mais obtenho 8 ROPs e 256 MiB adicionais, preferirei economizar para levar a versão mais ‘completa’, pois obteria um anti-aliasing com mais amostras, em resoluções mais altas nos jogos. Bom lembrar que a concorrente de ambas as GeForce GTX 460 são as placas de vídeo equipadas com o processador gráfico Radeon HD 5830, cujo preço baixou para o patamar de “duzentão dos obama”.

E aqui vamos às estrelas do presente post, justamente por serem mais recentes: placas de vídeo equipadas com a GeForce GTS 450, que serão pechinchas na faixa dos 130 dólares.

Laguna_GTS450GPUspe_27set2010

Ficha técnica da GeForce GTS 450

  • Codinome GF106, que representa a exata metade do GF104 (GeForce GTX 460);
  • 1,17 bilhões de transístores litografados a 40 nm;
  • Pastilha de silício com área de 240 mm²;
  • TDP de míseros 106 watts;
  • 1 GPC, 4 SMs;
  • 192 ALUs (aka CUDA Cores) a 1,566 GHz;
  • 32 TMUs e 16 ROPs a 783 MHz;
  • 1 GiB de memória a 902 MHz (3,608 GHz GDDR5), com interface 128 bits.

E esses números todos servem para tentar bater a Radeon HD 5770, cujo preço baixou, de forma misteriosa, dos 160 dólares do lançamento para os 130 dólares.

Laguna_R5kJuniperXT_27set_2010

Números da concorrente, a Radeon HD 5770

  • Codinome Juniper XT, que representa a exata metade do Cypress XT (Radeon HD 5870);
  • 1,04 bilhões de transístores litografados a 40 nm;
  • Pastilha de silício com área por volta dos 170 mm²;
  • TDP de respeitáveis 108 watts;
  • 5 Stream Clusters;
  • 160 Stream Processors (um total de 800 ALUs), 40 TMUs e 16 ROPs correndo a 850 MHz;
  • 1 GiB de memória a 1,2 GHz (4,8 GHz GDDR5), com interface 128 bits.

Qual será o significado de tantas informações, em termos de desempenho nos jogos?

Laguna_DiRT2bGuru3D_27set2010 Laguna_BBC2Canucks_27set2010

Como podemos ver no teste no jogo DirectX 11 Colin McRae DiRT 2, realizado pelo Guru 3D, a Radeon HD 5770 consegue desempenho de 45 fotogramas por segundo contra os 37 fps de uma GeForce GTS 450 da Palit.

Já o teste do Hardware Canucks, com o jogo DX11 Battlefield: Bad Company 2 na mesma resolução do DiRT 2 (1920×1200), mostra uma GeForce GTS 450 da eVGA bem mais estável que a Radeon HD 5770, pois a taxa de fotogramas por segundo na GF106 da eVGA possui queda de até 19 fps, mas mantém taxa média de 25 fps; enquanto a 5770 consegue cair até 17 fps, embora mantenha taxa média, de renderização em tempo real, de 29 fps em situação de jogo.

Laguna_CoDMW2th1920_27set2010 Laguna_MassEffect2A_27set2010

No teste do jogo DirectX 9c Call of Duty: Modern Warfare 2, feito pelo Tom’s Hardware na mesma resolução (1920×1200), temos a Radeon HD 5770 com quase 10 fps a mais que a GeForce GTS 450 quando o anti-aliasing a 4 amostras é ativado. Quando desativado, tal diferença cresce para quase 14 fotogramas por segundo.

Para terminarmos com chave de ouro, temos o teste da Anandtech com o jogo DX10 Mass Effect 2, onde uma GeForce GTS 450 da eVGA conseguiu 3 fps a mais que a Radeon HD 5770.

Enquanto notamos esses bons resultados das novas GPUs DX11 da nVidia no setor desktop, a empresa lançou sete processadores gráficos para computadores portáteis, baseados nos novos SMs e com os seguintes codinomes para os chips: GF104M, GF106M e GF108M.

7 novas GPUs da nVidia para os portáteis

Em junho, a nVidia lançou o GeForce GTX 480M (GF100M), uma versão do Fermi com 11 SMs funcionais.

Isso mesmo, gente, a nVidia ousou colocar, literalmente, uma GeForce GTX 465 (com freqüências menores para conter o consumo, obviamente) como GPU topo de linha do setor portátil.

Tal discrepância na nomenclatura entre as GPUs desktop e os processadores gráficos dedicados para portáteis já é “tradição” da empresa e desde a geração DirectX 11 que a concorrente, a AMD+ATi, faz o mesmo: coloca como GPU topo de linha, dos computadores portáteis, uma Radeon HD 5770 renomeada como Mobility Radeon HD 5870.

Laguna_NotebookS2_27set2010

Bom relembrar que o módulo atualizável da Mobility Radeon HD 5870 (Radeon HD 5770) possui metade do desempenho de uma placa de vídeo para desktops com a Radeon HD 5870. Tal diferença poderia levar alguns consumidores a presumir que estão a comprar um notebook do tipo “desktop replacement” com um desempenho em gráficos mais elevado que a situação real.

Voltemos ao presente mês, setembro, no qual a nVidia aproveitou os novos chips, já com os SMs modificados, para lançar os sete seguintes processadores gráficos dedicados à computadores portáteis (módulos MXM):

  • GeForce GTX 470M – GF104M, são 6 dos novos SMs a 1,1 GHz / 535 MHz, com até 1 GiB de memória à freqüência 1,25 GHz (4 GHz GDDR5) e interface 192 bits;
  • GeForce GTX 460M – GF106M, é 1 GPC inteiro, com os 4 novos SMs a 1,35 GHz / 675 MHz e mesmo tipo de memória da GTX 470M;
  • GeForce GT 445M – GF 106M, são 3 SMs a 1,18 GHz / 590 MHz e pode usar o mesmo tipo de memória da GTX 470 ou mesmo até 1 GiB de memória a 800 MHz (1,6 GHz GDDR3) com interface 128 bits, caso a fabricante da placa (não é a nVidia) queira uma versão mais barata;
  • GeForce GT 435M (1,3 GHz / 650 MHz) e GeForce GT 425M (1,12 GHz / 560 MHz) – ambas vêm do GF106M e são constituídas por 2 SMs, que acessam até 1 GiB de memória a 800 MHz (1,6 GHz GDDR3), com interface 128 bits;
  • GeForce GT 420M – GF106M, são os mesmos 2 SMs das GPUs anteriores, só que à humilde freqüência 1 GHz / 500 MHz e até 512 MiB da mesma memória GDDR3;
  • GeForce GT 415M – GF108M, basicamente a metade da GeForce GT 420M e mantendo as mesmas freqüências e interface de memória: único SM a 1 GHz / 500 MHz e até 512 MiB de memória a 800 MHz (1,6 GDDR3), com interface 128 bits.

Bom perceber que tais GPUs mobile podem indicar o caminho que a nVidia adotará nas configurações mais baratas para as placas de vídeo nos desktops. Outro ponto que podemos notar foi a necessidade de a camaleão verde modificar a microarquitetura de seus processadores gráficos para atender tanto o segmento popular dos desktops quanto o ramo das GPUs dedicadas para computadores portáteis.

Em ambas as frentes, a nVidia não oferecia boa concorrência à série Radeon HD 5000 da AMD, no quesito desempenho por watt. Fora o facto de a nVidia não possuir, até então, produtos DirectX 11 que atendessem várias faixas de preço, especialmente nas mais populares e acessíveis.

Agora sim a nVidia se faz presente no mercado, pelo menos até as boas vindas da concorrente com (aleluia, irmãos fanÁTIcos!) uma nova microarquitetura.

Série Radeon HD 6000, from ATi with love…

Laguna_RadeonHD6870_27set2010

Diversos rumores circulam pela internê à respeito dos codinomes Cayman e Barts, que possuem relação direta com as futuras GPUs da divisão de processadores gráficos da AMD, com lançamento previsto para outubro.

O mais interessante deles seria que os próximos processadores gráficos Radeon HD (6000, mesmo?) terão os clássicos Stream Processors totalmente modificados: ao invés de ser composto por 5 ALUs (uma ALU mais complexa e outras quatro mais simples), aparentemente os novos Stream Processors serão compostos por 4 ALUs de média complexidade.

O tio Laguna especula que tal modificação não alteraria o tamanho físico dos chips por si só, mas a AMD talvez aumente levemente o tamanho dos tais novos chips para abrigar mais Stream Clusters.

Óbvio que a nVidia não esperará a série Radeon HD 6000 desembarcar toda no mercado para aí sim ‘fazer alguma coisa’: o tio Laguna arrisca dizer que a modificação nos SMs dos atuais chips da camaleão verde servirá mesmo para a segunda geração da microarquitetura Gráficos Fermi e a empresa não tardará tanto o lançamento dos produtos quanto nesta primeira geração DirectX 11…

Devemos torcer mesmo é para ele, nosso bolso: concorrência acirrada assim só beneficiará a nós jogadores, isso se a pirataria dos jogos no PC não fizer mais vítimas.

Relacionados: , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,

Autor: Emanuel Laguna

O “tio Laguna” nasceu no Siará em meio à Fortaleza de 1984. Sempre gostou de brincar de médico com os aparelhos eletrônicos e entender como um hardware dedicado a jogos funciona, mas pretende formar-se como Engenheiro Eletricista qualquer dia. Antes apaixonado pelos processadores gráficos desktop, vê nos smartphones, tablets e outras geringonças mobile o futuro da computação.

Compartilhar
  • http://twitter.com/ricardo_mello Ricardo Mello

    Achei o post meio vago…

    *hehehe boa laguna! lol

    • http://meiobit.com/author/Max_Laguna/ Emanuel Laguna

      @Ricardo Mello, se não fosse a segunda linha eu não entenderia teu sarcasmo. :-) 😀 😆

  • http://www.facebook.com/rocha.andre André Rocha

    Ele bateu o record de tags?

    • http://meiobit.com/author/Max_Laguna/ Emanuel Laguna

      @André Rocha, até o momento, sim. Mas não bati meu meu próprio recorde de links: no presente tópico foram 42 diferentes links, enquanto o meu post com mais links possui 49. 😆

  • lucianoroch

    Nossa, tem link pra metade da internet nesse post! hehe
    De qualquer forma, é bom ver que a minha querida 5770 tá atual ainda.

  • abraaocaldas

    No setor mobile ela ainda tem que suar muito a camisa, hoje comprei um notebook, e entre um core2duo com uma placa de video péssimo a um radeon 4250, acabei optando pelo processador da amd + ati.

    O que adianta ter um bom processador se na hora que for jogar tibia a placa de video “intel GMA” engasga….

  • http://prazersemsentido.wordpress.com Krash Destrutor

    Eu me irrito prfundamente com essa mania de renomear placa velha com o nome da mais atual e botar uma “versão mobile” pra disfarçar. Isso pra mim é desonestidade pura, mesmo quem tem algum conhecimento em VGAs acaba sendo enganado.
    Outra coisa que me incomoda na nVidia é esse hábito de dar uma numeração maior para chips inferiores. É contra intuitivo, mas pelo menos é o tipo de informação que só quem realmente pesquisa acaba encontrando, porque definitivamente iria confundir um leigo.
    Mas enfim, agora é esperar o lançamento da série 6000 pra ver se o preço da HD5870 cai para um preço acessível para mim…

  • Wallacy

    Acredito que no lugar de dar nome de ALU para cada cuda core, poderia simplesmente dizer “core”, afinal, não deixa de ser um núcleo “seperado”. Pois tecnicamente possui muito mais instruções que uma ALU tradicional, e de fato é a unidade básica de calculo da placa podendo processar diferentes informações em “cada core”.

    Ao chamar tudo de ALU nos remete a arquitetura serial, onde cada ALU é parte do conjunto de um único core. O que não é verdade no caso de uma arquitetura paralela, onde cada um se comporta como um núcleo de processamento diferente, implementando inclusive alguns conjuntos de instrução mais avançados.

    A nVida deu o nome de CUDA core, justamente pelo conceito de GPGPU, pois esses cores podem ser utilizados para coisas mais “complexas”. Tanto é, que ao se programar para CUDA, você faz controle de threads se baseando no numero de “cores”. Podendo inclusive dar instruções separadas para cada um.

    Os Stream Processos da ATI segue a mesma lógica, porém ao invés de separar em unidades bem mais básicas, como na nvidia, separa em conjuntos, por isso cada SP possui mais de uma ALU.

    No final são todos eles stream processos, (mesmo os cuda cores), pois são capazes de processar somente o fluxo de dados, sem capacidade de controle dos mesmos, guiados é claro pelo processador central.

    • http://meiobit.com/author/Max_Laguna/ Emanuel Laguna

      @Wallacy, o processamento gráfico não é apenas paralelo: os CUDA Cores e os Stream Processors fazem o trabalho mais leve e tal trabalho ainda passará pelas TMUs e ROPs. Chamo-os de ALUs por motivo que revelarei durante a GPU Wars. 😉

      • Wallacy

        @Emanuel Laguna,

        Sim, por isso mesmo não considero o termo ALU adequado, pois ali mesmo, além de efetuar um “simples calculo” como tradicionalmente uma ALU faria (geralmente é uma pequena sequencia), o processamento ainda passa por mais etapas (por isso o conceito de stream processor e não de processadores plenos).

        Por isso mais adequado mesmo é considerar como um simples “core”, lembrando que por mais que existam TMUs e ROPs para os gráficos, os cuda cores e os stream processos da AMD são pensando já no conceito de GPGPU, onde para eles podem/são atribuídos cálculos não gráficos (até mesmo em games).

        Como você pode ver no gráfico que você mesmo postou, cada cuda core é constituído por 5 componentes básicos:

        – Uma unidade de ponto flutuante (FPU): Que por sua vez possui algumas ALUs e outros circuitos complexos.
        – Uma unidade de inteiros: Ai sim você tem uma ALU.
        – Coletor de operações: Para saber que tipo de operação será feita, o que não é de fato tão complexo assim, porém é um circuito análogo a uma ALU em quantidade e orientação de componentes.
        – Dispatch port e Result Queue que basicamente só responsáveis por coletar e enviar os resultados, com baixa complexidade similar a um circuito multiplexador(sem esse objetivo é claro).

        No final, independente disso, ainda é “injusto” chamar um “core” completo de ALU, até porque ele é composto de varias ALUs, pois é uma unidade muito mais basica, que inclusive existem em vasta quantidade dentre de cada core.

        Você que é tão apegado a termos tecnicos, corrigindo “voltagem” e coisas assim. Não deveria então chamar uma unidade de processamento completa (ou quase completa) de ALU, que é um dos muitos componentes da mesma.

        • http://meiobit.com/author/Max_Laguna/ Emanuel Laguna

          @Wallacy, no próximo post, desfiz tal equívoco e lhe pedi desculpas. Agradeço mesmo tua observação, tio. 😉

  • vinicius.sena

    Não esqueçam que a AMD ainda tem um coringa chamado HD5850, uma queda de 15% a 20% no preço dela enterra o ganha pão da nvidia.

    • http://meiobit.com/author/Max_Laguna/ Emanuel Laguna

      @vinicius.sena, E a Radeon HD 5830, que concorre diretamente contra a GeForce GTX 460, como fica?
      😛
      Tem que ver isso aí: se baixa o preço de uma, as outras mais (alguma mais potente e alguma menos potente) próximas também sofrem desconto. 😎

  • http://twitter.com/danieltwist Twist

    Ótimo post laguna.

    a AMD está com tudo.

    podiam comentar esse lançamento aqui no meio bit tb:

    http://developer.amd.com/zones/java/pages/Aparapi.aspx
    http://www.infoq.com/news/2010/09/aparapi-java-and-gpus

    a AMD parece que entrou nos eixos, finalmente.

  • Rickd

    Finalmente será que poderei rodar Crysis com tudo no maximo em 60fps e resolucao Quad Full HD?

  • Darkus

    fico feliz de ter comprado uma HD5770 sem saber o quão realmente boa ela era.
    pq paguei 300 reais enquanto a que se aproxima dela da Nvidia custa MIL PILAS! O_o

    • http://meiobit.com/author/Max_Laguna/ Emanuel Laguna

      @Darkus, a GeForce GTS 450 ainda é lançamento e, lá fora, era para ter o mesmo preço: ao menos você pode dizer que notebook algum terá melhor desempenho… 😉

  • http://chantinon.blogspot.com chantinon

    Estou montando 4 Workstations com 2 GTX480 em cada…CUDA! Não vou ter tempo de fazer um estudo completo, mas esse pode ser meu primeiro post no Forum (Não sei se posso postar no forum, nunca pensei nisso!). Críticas (negativas) a Nvidia seriam maiores que a ATI/AMD, porém, tem coisas que só a INTEL faz por você… Ai sim, dá para meter o pau (grande) na empresa que tem “ad eternum” os processadores mais rápidos, o pior marketing e mesmo assim, 90% ama.

    • thE Masterkey Blaster

      @chantinon,
      Qualquer um pode postar no fórum. :)
      Se até o Rosano444 pode! 😀

  • shaolyn2k8

    GTS 450 1GB tá a um preço bem camarada na Mojostech.net, já comprei a minha por R$325,00 + Frete que não passa dos R$45,00 dependendo da região e no casa da Receita não sei se foi pura sorte, mas sinceramente eu considero essa GTS 450 uma opção muito viável a quem não pode gastar muito, é claro que por R$75,00 a mais você compra uma 5770 o que considero uma opção melhor ainda.

  • colision

    Aqui, ATI no 360 e no Wii, e intel HD (core i5) no note. Cansei de montar desktop. 😛