Nos últimos anos, os dispositivos móveis vêm se tornando cada vez mais poderosos, e móveis. A geração passada de SoC high-end, especificamente o Nvidia Tegra 3, Exynos 4 Quad e o  Snapdragon S4, estabeleceram um novo padrão móvel trazendo CPU’s de quatro núcleos para os dispositivos móveis, assim como trouxeram um grande desempenho em jogos sem sacrificar-se pelo consumo. Para isso, cada empresa utilizou soluções como a arquitetura 4-PLUS-1 (quatro núcleos de maior desempenho, acompanhados de um núcleo de baixa potência para lidar o sistema com menor drenagem de energia). Após esta evolução, os sucessores desses processadores tiveram o desafio de melhorar o desempenho e também a economia de seus produtos. Cada fabricante também apresentou suas soluções.

Os três SoCs citados no título deste artigo tem ao menos uma coisa em comum: a sua litografia (processo de produção). A Qualcomm vem usando 28nm desde o ano passado, a NVIDIA deu um grande salto da arquitetura de 40nm para 28nm HKMG e a Samsung está atualizando o seu próprio processo de produção em 32nm para 28nm HKMG.


CPU:

O núcleo Cortex A15 da ARM já se mostrou muito potente desde seu uso no processador Exynos 5 Dual, lançado e utilizado pela Samsung no tablet Nexus 10. Neste produto, a CPU superou todos os outros processadores em benchmarks inclusive os Quad-Cores. Nesta geração o desempenho é praticamente dobrado já que veremos Cortex A15s sendo usados em processadores Quad-Core.

O NVIDIA Tegra 4 manteve a arquitetura 4-PLUS-1 já utilizada em sua versão antecessora, mas desta vez com um núcleo Cortex A15 com clock de até 1,9Ghz, uma capacidade impressionante. No entanto, o consumo de energia seria alto. O quinto núcleo chega para solucionar o problema de consumo, pois também é um Cortex A15, porém projetado para tarefas leves como a reprodução de áudio e vídeo, por exemplo, e é usado para moderar o uso dos outros núcleos. Este quinto núcleo pode trabalhar 825Mhz tendo aproximadamente o desempenho de um Cortex A9 single-core de 1,6Ghz.
O Tegra 4 também tem um irmão intermediário chamado Tegra 4i. Este tem o processador um pouco diferente, ainda empregando 4-PLUS-1. O 4i não usará núcleos A15, mas uma melhoria da versão mais recente do velho Cortex A9 quatro núcleos A9 será capaz de correr em até 2,3 GHz, onde deverá trazer um bom desempenho ao processador.

O Samsung Exynos 5 Octa (presente no Galaxy S4 versão 3G. Já na versãon 4G é utilizado um Snapdragon 600) tem até um nome que chama a atenção das pessoas para a CPU, uma vez que o nome indica o primeiro SoC de integrar 8 núcleos na CPU, mas isto não significa que vamos ver o desempenho de 8 núcleos em um dispositivo móvel.
O Octa é realmente o primeiro SoC a usar configuração big.LITTLE da ARM. Um conceito semelhante ao da NVIDIA 4-PLUS-1. O Octa faz o uso de quatro núcleos Cortex A15 com uma velocidade máxima de clock de 1,8 GHz para cargas de trabalho pesadas e um conjunto de Cortex-A7 mais básico rodando em até 1,2 GHz para moderar o consumo de energia. A CPU Cortex A7 é praticamente igual a um Cortex A9, só que com melhor eficiência de energia, assim, os núcleos de baixa potência são capazes de entregar desempenho suficientemente alto por um consumo de energia menor como um quad-core Cortex A9@1.2GHz (Tegra 3 T30L, por exemplo). É justo supomos que os núcleos de baixa potência estarão em uso com maior frequência ao núcleo presente no Tegra 4, onde garante à Samsung uma vantagem em termos no consumo de energia, mas na prática, as coisas poderão ser diferentes.

A Qualcomm é conhecida por não licenciar CPUs ARM completas, mas ao invés disso, eles licenciam a arquitetura e a modifica para fazer uma CPU personalizada, chamada por eles de núcleo Krait desde o Snapdragon S4. CPUs Krait tendem a sobressair muito bem em termos de consumo de energia. Para o Snapdragon 800, a Qualcomm empregará um novo núcleo personalizado, o Krait 400 onde será capaz de correr em uma frequência máxima impressionante de 2.3GHz. Os núcleos Krait têm uma característica especial: eles podem ter diferentes núcleos rodando em diferentes velocidades de clock com base na carga de trabalho que pode render alguns bons resultados em termos de eficiência energética.


Memória e GPU

Os games tornaram-se um aspecto importantíssimo para a tecnologia móvel. Como tal, os fabricantes de SoC, especialmente a Apple, investem muito na integração de excelentes GPUs em seus SoCs e as mais recentes ofertas da Samsung, NVIDIA e Qualcomm não são diferentes. A NVIDIA, ironicamente, nunca liderou o mercado de GPU móveis em sua série Tegra, mas o mesmo não pode ser dito sobre a GPU do Tegra 4. Projetado pela NVIDIA, a nova GeForce ULP é um enorme avanço em relação à última geração, como o Tegra 4, tem um total de 72 "núcleos" gráficos, contra 12 no Tegra 3. Até aqui são uma melhoria seis vezes maior, entretanto, o Tegra 4 continua sendo o único SoC moderno, cuja GPU usa pixels e vertex shaders independentes, ao contrário de uma arquitetura unificada. Os 72 núcleos no Tegra 4 são divididos em quatro unidades de pixels, cada um contendo 12 ALUs (que a NVIDIA refere-se como um "core"), bem como seis unidades de vertex, cada um contendo 4 ALUs.
A velocidade de clock máxima para a GPU são impressionantes 672MHz. A este ritmo, o Tegra 4 tem poder de transformação de 96,8 GFLOPS; um resultado líder da indústria, enfim. O Tegra 4i usa a mesma arquitetura de GPU como o Tegra 4, mas é diluída, com 60 núcleos totais. A 4i tem a mesma arquitetura, porém tem duas grandes unidades de pixels, cada um contendo 24 ULAs, enquanto a quantidade de ULAs pro Vertex é cortada pela metade no 4i, com apenas três unidades de vertex com vértice 4 ALUs cada. Com um clock ligeiramente menor, de 660MHz, a GPU do Tegra 4i tem um desempenho teórico máximo de 79 GFLOPS, que ainda é muito impressionante. Embora o desempenho das GPUs é impressionante, suas características não são tão impressionantes, como Tegra 4 tem uma das poucas GPUs modernas que não oferecem compatibilidade com OpenGL ES 3.0 completo (alguns recursos estão disponíveis, no entanto).

Tendo em conta que estamos agora em um momento onde a resolução está sendo uma grande necessidade para dispositivos móveis, estes SoCs precisam oferecer uma largura de banda de memória brutal. Esta demanda sempre foi uma grande preocupação nos SoCs Tegra, e a NVIDIA finalmente decidiu eliminar esse problema. O chip Tegra 4, destinado a “tablets high-end”, que, a partir de então, deverão ter uma resolução de pelo menos 1920 x 1200. Provavelmente, irá lidar com altas resoluções facilmente uma vez que a interface de memória é impressionante, sendo que ainda não estará inovando o dual-channel DDR3L-1866. Isto deve, na teoria, entregar uma taxa de preenchimento suficiente para jogar até mesmo os jogos mais complexos em um tablet com uma resolução muito alta (2560 x 1600), especialmente considerando as afirmações de que a NVIDIA GPU é otimizada para o uso da largura de banda da memória de forma mais eficiente.
Como o 4i está destinado aos smartphones, ele geralmente tem que lidar com resoluções mais baixas, de modo a NVIDIA optou por uma menos potente e com consumo de energia menor, e talvez um pouco econômico demais, porém o 4i tem apenas um único canal de memória LPDDR3. Na configuração PoP (pacote-a-pacote), onde a memória é soldada sobre o SoC, o Tegra 4i suporta até LPDDR3-1600 que é um tanto quanto a última geração, o Tegra 3. Se a memória é incorporada com o SoC (discreto), no entanto, o 4i irá suportar até um canal único LPDDR3-1866, metade do que o Tegra 4 pode fazer, o que não é realmente suficiente, especialmente considerando que em 2013 foi o ano de smartphones como 1080p..

O Exynos 5 Octa representa uma grande quebra de sua tradição de GPU habitual. A linha Exynos sempre usou GPUs Mali da ARM, mas os Exynos 5 move-se para uma GPU PowerVR, o PowerVR SGX544MP3, que é praticamente idêntica a GPU usada no iPad 3.
A linha de GPU da ImgTech tem uma arquitetura de sombreamento unificada muito madura e não suporta OpenGL ES 3.0 completo. Existem 12 unidades de shaders unificados neste GPU (quatro por módulo, pois este é o MP3, então, três módulos). Cada um dos quais contêm quatro ALUs. Mas, a diferença entre o SoC do iPad 3 e do Exynos Octa é que a SGX544MP3 do Octa tem clock muito mais alto: 533MHz. Isto equivale a 51,1 GFLOPS de desempenho de pico, onde é quase exatamente o meio entre os 32 GFLOPS do iPad 3 e 71,6 GFLOPS do iPad 4. Olhando para esses números, parece que o Exynos 5 Octa não conseguirá manter-se junto a concorrência em tudo. Seu desempenho, pelo menos no papel, empalidece em comparação com a oferta competitiva da NVIDIA. A interface de memória do Octa ainda não é conhecida, mas provavelmente será um pouco parecida, ao menos melhor ao seu irmão mais novo, o Exynos 5 Dual, que tem uma interface de memória DDR3-1600 dual-channel, o que deve realmente ser bom, mesmo para os tablets de 2560x1600 pixels de resolução.

Infelizmente, a Qualcomm nunca divulga qualquer informação sobre suas GPUs Adreno, então tudo o que sabemos é que o Snapdragon 800 tem uma GPU Adreno 330, que deverá fornecer o mesmo conjunto de recursos que a Adreno 320, mas com capacidades de desempenho mais elevadas. Considerando-se que a Adreno 320 já é uma das mais poderosas GPUs disponíveis, muito se espera do modelo 330. Além do desempenho, o 330 será um processador gráfico com suporte a OpenGL ES 3.0, e isto é praticamente tudo o que é conhecido, mas a GPU presente no Snapdragon 800 deve superar até mesmo a GPU do poderoso Tegra 4, já que a Qualcomm se mantém muito bem no segmento e estava preparada quando lançou o Snapdragon 800 muito confiante de suas capacidades de liderança. Muito parecido com o Exynos 5 dual e, provavelmente, o Octa também, interface de memória do Snapdragon 800 será de dois canais de memória DDR3-1600.


Conclusão

Todos esses SoCs têm muitas semelhanças, bem, exceto o Tegra 4i, que é claramente destinado a ser um SoC mid-range, e não pode competir com qualquer um dos outros SoCs topo de linha. Estes são semelhantes, sendo que todos eles usam processo de 28nm. Eles são todos quad-cores de novas arquiteturas, e todos eles têm algum método de reduzir o consumo de energia. No caso da NVIDIA e Samsung, a solução é aumentar a eficiência de energia, adicionando núcleos de baixa potência para lidar com cargas de trabalho simples. Enquanto a Qualcomm fez escolher ter seus núcleos com clock assíncronos. Suas principais diferenças vêm de suas GPUs. Enquanto a Samsung, estranhamente, opta por utilizar uma GPU que não é muito competitiva. A NVIDIA e a Qualcomm leva desempenho em jogos muito a sério e melhoraram suas ofertas de GPU.
Em termos de memória, de fato, todos esses SoCs têm interfaces de memória quase idênticas, então a principal diferença será o grau de eficiência da CPU e da GPU ao usar a largura de banda de memória.

Considerando o mercado atual, o mais bem sucedido destes SoCs, anunciados todos no começo do ano, é o Snapdragon 800. O Exynos Octa apesar de ter sido usado em versões 3G do Galaxy S4 não teve vendas expressivas graças ao escândalo de trazer big.LITTLE quando nem mesmo o kernel linux o suportava (tendo adicionado suporte logo após a adoção da Samsung), tendo sido considerado pouco eficiente na função que se propõe (economizar energia) e esquentando bastante. O Tegra 4 não teve boa adoção por não suportar em sua versão convencional e mais potente, redes 4G LTE. Por outro lado, o Snapdragon 800 trouxe conexão 4G LTE Advanced de altíssima velocidade, aliado ao melhor desempenho do mercado, tendo um regulado consumo de energia e tendo conquistado os consumidores.

0 comentários:

Postar um comentário