Armament GPU Mali-G77: els complements i les sortides completes

Autora: Randy Alexander
Data De La Creació: 3 Abril 2021
Data D’Actualització: 1 Juliol 2024
Anonim
Armament GPU Mali-G77: els complements i les sortides completes - Tecnologies
Armament GPU Mali-G77: els complements i les sortides completes - Tecnologies

Content


Al costat del nou nucli de CPU Cortex-A77, Arm ha presentat una GPU de nova generació destinada als SoCs de telèfons intel·ligents de nova generació. El Mali-G77, que no s'ha de confondre amb el nou processador de visualització Mali-D77, marca la sortida de l'arquitectura Bifrost de Arm i el trasllat a Valhall.

Entrarem en un instant els detalls excel·lents de la nova arquitectura. En primer lloc, farem un bon repàs a allò que els usuaris haurien d’esperar en termes de guanys de rendiment.

Visió general del rendiment Mali-G77

Arm ofereix un augment de rendiment gràfic del 40 per cent amb dispositius Mali-G77 de pròxima generació en comparació amb els models Mali-G76 actuals. Aquest número té en compte el procés i les millores arquitectòniques. El Mali-G77 es pot configurar entre 7 i 16 nuclis d'ombra, i cada nucli és gairebé exactament la mateixa mida que el nucli G76. Això vol dir que els telèfons intel·ligents de gamma alta probablement s’enviaran amb comptes bàsics de GPU similars com ho fan avui, en algun lloc dels adolescents baixos. Això permet fer algunes valoracions especulatives del rendiment respecte als chipsets existents.


Tenint en compte el referent popular de Manhattan GFXBench, un augment del rendiment del 40 per cent obre un avantatge important contra el maquinari de generació actual. El xip Adreno de nova generació de Qualcomm necessitarà una actualització important del seu rendiment per mantenir el nivell de joc. Sembla que les taules es mostren a favor de Arm.

Arquitectura encertada, el rendiment de jocs augmenta del 20 al 40%, mentre que l'aprenentatge automàtic obté un augment del 60%

Basat en aquest ballparking bastant brut, un Mali-G77 de deu nuclis (una configuració que veiem sovint des de Huawei) sembla gairebé a la vora del maquinari gràfic mòbil de la generació. Una configuració de 12 nuclis, que normalment es mostra a Exynos de Samsung, proporciona un avantatge important a l'última GPU de Arm. Per descomptat, els punts de referència reals dependran d’altres factors, com ara el node de procés, la memòria cau GPU, la configuració de memòria LPDDR i el tipus d’aplicació que estàs provant. Així que cal agafar el gràfic anterior amb una forta dosi de sal.


Quant a la nova arquitectura, Arm afirma que el Mali-G77 ofereix una millora del 30% de mitjana en termes d'eficiència i rendiment energètics. També hi ha un augment del 60 per cent de les aplicacions d'aprenentatge de màquines, gràcies al suport de productes INT8 dot. Les expectatives de rendiment dels jocs es situen entre un 20 i un 40 per cent, segons el títol i el tipus de càrrega de treball gràfica que s'ofereix.

Per entendre exactament com Arm ha aconseguit aquesta elevació de rendiment, aprofundim en l'arquitectura.

Coneix Valhall, el successor de Bifrost

Vahall és la segona generació d'arquitectura escalar GPU. Es tracta d’un motor d’execució d’ordit de 16 àmplies, cosa que significa essencialment que la GPU executa 16 instruccions en paral·lel per cicle, per unitat de processament, per nucli. Té una amplada d'entre 4 i 8 d'ample a Bifrost.

Altres novetats arquitectòniques inclouen la programació d’instruccions dinàmiques gestionada completament en maquinari i un conjunt d’instruccions completament nou que conserva l’equivalència operativa a Bifrost. Altres inclouen suport per al format de compressió AFBC1.3 de Arm, objectius de renderització FP16, renderització en capes i sortides d'ombra de vèrtex.

El Mali-G77 fa un 33% més de matemàtiques en paral·lel que el G76.

Les claus per comprendre els principals canvis arquitectònics es troben examinant la unitat d’execució dins del nucli. Aquesta part de la GPU s’encarrega de l’agitació de números.

Dins del motor d’execució

A Bifrost, cada nucli de la GPU contenia tres motors d’execució o dos en el cas d’alguns dissenys de gamma baixa del Mali-G52. Cada motor conté un i-cache, un fitxer de registre i una unitat de control d’ordit. Al Mali-G72, cada motor té 4 instruccions per cicle, que van augmentar fins a 8 el Mali-G76 de l'any passat. Estès per aquests tres nuclis permet obtenir instruccions de multiplicar-acumular (FMA) de 12 i 24 punts de flotació (FP32) de 32 bits.

Amb Valhall i el Mali-G77, hi ha un sol motor d’execució dins de cada nucli de la GPU. Com abans, aquest motor allotja la unitat de control d’ordit, registre i icache, que ara es comparteix en dues unitats de processament. Cada unitat de processament gestiona 16 instruccions d’ordit per cicle, per un rendiment total de 32 instruccions FP32 FMA per nucli. Això suposa un augment del 33 per cent de la transferència d’instruccions sobre el Mali-G76.

El braç ha passat de tres a una sola unitat d'execució per nucli de GPU, però ara hi ha dues unitats de processament dins d'un nucli G77.

A més, cadascuna d’aquestes unitats de processament conté dos nous blocs de funcions matemàtiques. La nova unitat de conversió (CVT) gestiona instruccions bàsiques d’enters, lògica, branca i conversió. La unitat de funcions especials (SFU) accelera la multiplicació, divisions, arrel quadrada, logaritmes i altres funcions enteres complexes.

La unitat FMA estàndard ha experimentat alguns retocs, que admeten 16 instruccions FP32 per cicle, 32 FP16 o 64 instruccions del producte INT8. Aquestes optimitzacions produeixen un augment del rendiment del 60 per cent en aplicacions d'aprenentatge automàtic.

El mapeador de textures quad

L'altre canvi clau del Mali-G77 és la introducció d'un mapeador de textures quad, des d'un mapa de dues textures de la generació anterior. El mapeador de textures és el responsable de mapar els polígons 3D en una escena en la representació 2D que veieu a la pantalla. És responsable del mostreig, la interpolació i el filtratge per allisar el contingut en anglès i moure per evitar vores de qualitat baixa i dura.

Es manté un anti-aliasing de baix cost per ajudar a la qualitat de la imatge, però és aquí el doble avantatge del rendiment de la textura. Ara la unitat de textura processa 4 textures bilineals per rellotge fins a 2 anteriors, 2 textures trilínies per rellotge i maneja un filtratge més ràpid FP16 i FP32.

El mapeador de textures de quad es divideix en dos camins, proporcionant una canalització més curta per a fils que afecten contingut a la memòria cau. La ruta de miss, que gestiona la conversió de format i la descompressió de textures, ofereix una interfície més ampla a la memòria cau L2. Això també és útil per a les càrregues de treball per a l'aprenentatge automàtic que potser necessiten sovint obtenir noves dades de la memòria.

Reunint-ho tot al Mali-G77

Arm ha fet alguns altres retocs al Mali-G77 per coincidir amb els canvis importants en l'arquitectura Valhall. El bloc de control es simplifica gràcies al disseny de la unitat d’execució única, mentre que el planificador dinàmic intern permet una emissió d’instruccions més flexible dins de cada nucli. Amb un ritme més elevat a cada nucli, la base de dades és també més curta i baixa en latència, fins als 4 cicles dels 8 anteriorment.

El nou disseny també s'alinea millor amb l'API Vulkan, simplificant els descriptors del controlador per reduir les despeses del conductor per millorar el rendiment "al metall".

En resum, el Mali-G72 i Valhall fan canvis importants des de Bifrost que prometen importants augments de rendiment per a aplicacions de jocs i aprenentatge automàtic. És important destacar que el disseny s’ajusta als mateixos pressupostos de potència i àrea que Bifrost, garantint que els dispositius mòbils podran oferir un màxim rendiment màxim sense preocupar-se dels costos de calor, energia i silici. A partir de les projeccions de rendiment, el Mali-G77 hauria de poder donar a Adreno el proper gen de Qualcomm una bona quantitat de diners.

E upoa que una nova filtració motra el OnePlu 7 al cotat del OnePlu 6T.La imatge revela que el proper buc inígnia de la companyia podria tenir un dieny llicant.Un factor de forma llicant eri...

Tot i que età fora de l’àmbit d’aquet tutorial, també podeu utilitzar FCM per a notificacion a l’aire amunt, on FCM rep una de l’aplicació del client o per notificar la votra aplic...

Popular Al Lloc