Braç Cortex-A77: tot el que necessites saber

Autora: Randy Alexander
Data De La Creació: 2 Abril 2021
Data D’Actualització: 1 Juliol 2024
Anonim
Braç Cortex-A77: tot el que necessites saber - Tecnologies
Braç Cortex-A77: tot el que necessites saber - Tecnologies

Content


Juntament amb el seu nou processador gràfic Mali-G77 i el processador de visualització Mali-D77, Arm ha presentat el seu últim disseny de CPU d’alt rendiment: el Cortex-A77. Igual que amb el Cortex-A76 de l'any passat, el Cortex-A77 està dissenyat per a aplicacions de nivell premium que exigeixen la firma de baix consum de baix consum d'Arm. Tot, des dels telèfons intel·ligents passant per ordinadors portàtils i molt probablement més enllà.

Amb el Cortex-A77, Arm ha orientat les instruccions màximes per augment de rendiment de cicle / rellotge (IPC) que podria gestionar a través del Cortex-A76. Les freqüències de rellotge, el consum d’energia i l’àrea estan dissenyades per romandre aproximadament al mateix terreny, però el nou nucli es pot produir amb més instruccions alhora. Per fer-ho, Arm ha dissenyat un nucli encara més ampli que l'any passat i ha fet una sèrie de millores per mantenir el nucli de la CPU alimentat amb coses per fer. Però abans d’aconseguir-ho, aprofundim en els números de rendiment i la visió general d’alt nivell.


Assolir objectius de rendiment

A l'agost de 2018, Arm va compartir de manera descaracterística un full de ruta de la CPU fins al 2020. Des del 2016 del Cortex-A73 fins al disseny "Hercules" de la companyia, la companyia està promovent un augment de 2,5x en el rendiment de càlcul. Una gran part d'aquesta enorme projecció es va aconseguir amb el canvi de microarquitectura important amb el Cortex-A76, velocitats de rellotge modernes més altes, i el pas dels 16 als 10 i 7nm de fabricació amb 5nm a seguir. Al voltant de 1,8 x dels beneficis del full de ruta ja es van assolir l'any passat, i el Cortex-A77 proporciona un augment del IPC aproximadament un 20 per cent més. Això ens permet anar bé a l'objectiu de Armx 2.5x, tot i que els dispositius mòbils de potència limitada i pressupostos tèrmics no esperen veure tots aquests beneficis.

Per comparació, el Cortex-A76 de l'any passat va proporcionar un augment del 30-35 per cent respecte al Cortex-A75. Aquest any, estem contemplant un guany més intens del IPC del 20% entre l’A77 i l’A76. Aquesta és una bona notícia, ja que significa més rendiment mentre es mantenen restriccions tèrmiques i d’alimentació similars com fins ara. El compromís és que l'A77 és un 17 per cent més gran que l'A76, pel que costarà una mica més en termes de superfície de silici. Si voleu una comparació amb els líders d’escriptori, AMD va gestionar un impuls IPC del 15 per cent entre Zen2 i Zen +, mentre que l’IPC d’Intel s’ha mantingut pràcticament estàtic durant anys.Per descomptat, aquí parlem de diferents segments de mercat, però això demostra com l'equip de disseny de CPU de Arm ha aconseguit avantatges impressionants en les darreres generacions.


S'ofereix un augment del rendiment del 20% per als SoCs basats en Cortex-A77 de nova generació

El tema de recollida aquí és que l'A76 va marcar un important canvi microarquitectònic amb grans guanys de rendiment, mentre que tornem a la millora del nivell d'optimització amb l'A77. Amb tot això, anem a aprofundir en les novetats a Arm Cortex-A77.

Cortex-A77 es basa en la microarquitectura A76

La clau per comprendre la diferència entre el Cortex-A77 i el A76 és comprendre el que s’entén amb un disseny de nucli “més ampli”. Essencialment, estem parlant de la capacitat d’executar més instruccions per a cada cicle de rellotge, cosa que augmenta el rendiment del nucli. Hi ha dues parts importants per aconseguir aquest dret: augmentar el nombre d’unitats d’execució per fer el processament i garantir que aquestes unitats es mantinguin ben alimentades amb dades. Comencem amb aquesta darrera part i ens centrem en les parts de desviament, memòria cau i predicció de branques del SoC.

El Cortex-A77 augmenta el 50 per cent de l'amplada d'enviament, fins a sis instruccions per cicle de quatre amb l'A76. Això significa més instruccions dirigides al nucli d'execució de cada cicle de rellotge per obtenir un potencial de rendiment més gran. El resultat d'execució fora de comanda també és més gran, augmentant fins a 160 entrades per exposar més paral·lelisme. Hi ha una memòria cau d’instruccions de 64 k, mentre que el bàner d’objectiu de la branca (BTB), que té adreces per al predicció d’oficines, és un 33 per cent més gran que abans per gestionar el creixement d’instruccions paral·leles. Res estrany aquí, és essencialment una versió més àmplia del disseny de l'any passat.

L'addició de front-end més interessant és la nova memòria cau MOP de 1,5 K, que emmagatzema els macro-opcions (MOP) que es retroben des de la unitat de descodificació. L’arquitectura de la CPU de Arm descodifica les instruccions de l’aplicació d’un usuari en macrooperacions més petites i després cap endavant a les microoperacions que el nucli d’execució entén. Podeu veure-ho al diagrama anterior a la secció de descodificació. La memòria cau MOP s'utilitza per reduir la penalització de cost de les sucursals perdudes i els desperfectes, ja que manté la mà de les macro-opcions en lloc de decodificar-les de nou i augmenta el rendiment global del nucli. Les fetes del MOP en lloc de i-cache obliden l'etapa de descodificació, estalviant un cicle. Arm afirma que la memòria cau MOP pot assolir un 85% o més de percentatge d’èxits en una gamma de càrregues de treball, cosa que el fa una addició molt útil al cache i-i estàndard.

Al baixar a la part principal d'execució de la CPU, noteu l'addició d'una quarta ALU i una segona unitat Branch. Aquesta quarta ALU augmenta el 50 per cent de l'amplada de banda general del processador en un 50 per cent. Aquesta ALU addicional és capaç d’instruir les instruccions bàsiques d’un cicle (com ara ADD i SUB) a més d’operacions integrals de dos cicles com ara una multiplicació. Dues de les altres ALU només poden manejar instruccions bàsiques d’un cicle, mentre que la unitat final està carregada d’operacions matemàtiques més avançades com la divisió, la multiplicació d’acumulació, etc. pot gestionar el nucli, que és útil en casos en què dues de les sis instruccions enviades són salts de branca. Això sona una mica estrany, però les proves internes a Arm van revelar avantatges del rendiment de l’adopció d’aquesta segona unitat.

El Cortex-A77 ofereix un paral·lelisme millorat i una nova presa de memòria cau prèvia a la recuperació

Altres retocs al nucli de la CPU inclouen l’addició d’un segon pipeline de xifratge AES. Els pipelines del magatzem de dades ara disposen de ports d'emissió dedicats a duplicar l'amplada de banda del problema de memòria. Aquests ports eren compartits anteriorment amb les ALU, que de vegades podrien convertir-se en un coll d’ampolla. També hi ha un perfeccionador de dades d’última generació per millorar l’eficiència d’energia i augmentar l’ample de banda fins al sistema DRAM.

Una part d'aquest sistema del Cortex-A77 també inclou un sistema de preparació prèvia "completament conscient del sistema". Això millora el rendiment de memòria basat en una àmplia gamma de comptes de nucli de CPU, capacitats de caché i latències i configuracions del subsistema de memòria dins dels dispositius finals. El maquinari dedicat a converses amb la unitat de programació dinàmica (DSU) com a part d’un clúster de CPU DynamIQ, que supervisa l’ús de la memòria cau L3 compartida. El nucli presenta uns nivells de distància i agressivitat dinàmics per reduir l’ús de la memòria cau en situacions en què l’ample de banda de L3 està limitat per altres nuclis de CPU. Els nuclis de major rendiment com el Cortex-A77 són més propensos a saturar l'accés DSU a la memòria, mentre que és probable que els nuclis de potència més baixos com l'A55.

Encaixant-ho tot junt

Hi ha molts petits canvis al Cortex-A77 que aporten algunes diferències substancials al seu predecessor. En poques paraules, la nova memòria cau MOP de l’A77 combinada amb una finestra d’instrucció més àmplia i més llarga ajuda a mantenir ocupat l’ALU, la branca i les unitats de memòria ocupades amb coses pendents. El disseny de la potència Cortex-A76 s'ha ampliat per millorar el seu rendiment encara amb l'A77, sense dependre de velocitats de rellotge més altes.

L’augment més gran del rendiment a l’hora d’arribar al Cortex-A77 és la forma d’un número enter i de coma flotant. Això es confirma amb els punts de referència interns de Arm, que mostren un augment del rendiment del 20 al 35 per cent en els punts de referència dels números integrals i els punts flotants SPEC, respectivament. Les millores de l'amplada de banda de la memòria se situen entre el 15 i el 20 per cent, destacant de nou que els majors guanys es produeixen en la reducció de números. En general, aquestes millores donen a l'A77 un augment de mitjana del 20 per cent respecte a la generació anterior. També podem veure alguns guanys més marginals com a resultat de processos de fabricació més avançats de 7 milions a finals d’aquest any o a principis del 2020.

En termes de telèfons intel·ligents, els SoCs Cortex-A77 estan destinats a productes emblemàtics d’alt rendiment. Braç espera que el disseny de la central utilitzi els arranjaments bàsics de 4 + 4 bits. Tenint en compte l’augment de la potència i la lleugera pujada de la mida de l’àrea de l’A77, probablement veurem que els dissenyadors de SoC continuen baixant la tendència 1 + 3 + 4 o 2 + 2 + 4. Amb un o dos nuclis grans amb caché més gran i rellotges superiors, recolzats per 2 o 3 nuclis A77 amb mides de memòria cau més reduïdes i rellotges inferiors per estalviar energia i àrea. En última instància, el Cortex-A77 ofereix coses bones per als xips de telèfons intel·ligents i el creixent mercat per a ordinadors portàtils sempre connectats amb Arm. Mireu els anuncis de silici a finals d’any.

El Bluetooth é extremadament convenient, però cota molt.Podeu trobar una decripció mé detallada del procé de prova i del decobriment, però aquí hi ha el gran moment:...

Poter u pregunteu i el auricular de conducció òia funcionen realment. De fet, í, i no é exactament la bruixeria. Al cap i a la fi, el o nomé ón vibracion de l’aire. En ca...

Llegiu Avui