MCC vagy Matrix Computing Coprocessor, a jövőbeli A13 CPU új eleme

A Bloomberg megnyitotta a tilalmat. Néhány hétre van még a (vélhetően) jövő szeptember 10-i pletykás esemény, az iPhone új generációjának bemutatója. És ha meghallgatjuk, amit Mark Gurman és Debby Wu mondott a közelmúltban, akkor az iPad Pro, az új 10,2 "oktatási iPad és az új 16" MacBook Pro felújítását is tapasztalhatjuk. Ha többet szeretne tudni, itt van a cikk, amely számold meg az összes pletykát.

De itt valami (számomra) fontosabb dologra fogunk koncentrálni, mint 3 kamera iPhone-on vagy 10'2 iPad. Ma az agyakról és egy új társprocesszorról beszélünk, amelyet Gurman fejlesztett ki, amely magában foglalná a jövőbeni A13-at, amely intelligenciát adna az eszközök új generációjának. AMX nevű társprocesszor, amely lebegőpontos mátrixszámításra specializálódott. A számítógépes látás és a kibővített valóság támogatására tervezett chip. Tehát el fogjuk mondani, hogy miből fog állni és milyen funkciói lesznek.

Heterogén számítástechnika

Ez a kulcsa a ma gyártott ARM architektúra alapú processzorok fejlődésének. Ellentétben azzal, amit gondolhat, amikor látunk egy viszonyítási alapot, ahol az iPad Pro új A12x-je szinte ugyanolyan teljesítményt ér el, mint egy csúcskategóriás Intel CPU, mint a 2018-as MacBook Pro, valójában a történet felét meséljük el, és ez az érték "félrevezet" minket.

Ugyanúgy, mint manapság a processzor órajelének gigahertze nem jelzi a sebességét, mivel az a processzor generációjától, alkotóelemeitől, tranzisztoraitól és másoktól függ, a benchmark nem képes megragadni a valódi problémát, amely ma van energiatakarékosságra tervezett ARM architektúra: hogy architektúrája definíció szerint lassabb, még akkor is, ha ugyanazon kritériumok alapján mérjük az eredményeket.

Néhány gyors példát mutatunk be, hogy megértsd. Egy olyan x86-os processzor, mint bármelyik Mac által használt Intel, ezernyi utasítással rendelkezik. A legalapvetőbbektől (például egy összeg) egészen a bonyolultabbakig, mint például a memória mozgásai az egyes komponensek között, és akár nagyon specifikus számítások, például videó adatkészlet kódolása.

Ötletet adni: a CPU nem ugyanaz (mint sok évvel ezelőtt), amely csak hozzá tudott adni, és a szorzáshoz sok összeget kellett tennie, ami amelyiknek többszörös utasítása van és egyetlen utasításban végrehajtja az összes műveletet.

A 64 bites x86 architektúra utasításkészlete 5000-nél több utasítással rendelkezhet, és ehhez hozzá kell adnunk más nagyon specifikus utasításokat a multimédia, lebegő számítás, videó feldolgozás különböző utasításainak részhalmazaitól, Az ARM, amely kevesebb energiafogyasztó architektúrát tesz lehetővé, lényegesen kevesebb művelettel rendelkezik.

Ráadásul ott van az utasítások mérete. Az x86-ban minden utasítás más méretű, a legalapvetőbb és leggyakrabban használt utasításokkal, amelyek csak 8, esetleg 16 bitet foglalnak el. Mindazonáltal, az ARM-ben minden utasítás ugyanazt a 32 bitet foglalja el, még akkor is, ha számozási szinten rövidek. Ezért, míg az x86 képes több utasítás feldolgozására másodpercenként, mert mindegyiknek más a mérete (dinamikus), az ARM-ben a másodpercenként feldolgozandó utasítások száma állandó.

Ez csak néhány észrevehető különbség. Emiatt az ARM architektúra megmentése, amely lehetővé teszi az x86 architektúrához (valós) összehasonlítható hatékonyság elérését, heterogén számítástechnika. A processzor azon képessége, hogy különféle speciális összetevőket tartalmazzon magában. Tegyük fel, hogy egy x86 izomot játszik egy olyan processzorral, amely dinamikus méretű utasítások ezreit teszi lehetővé, de általánosabb műveletekre szánják. Az ARM azonban azt csinálja, hogy a CPU általános esetekre hagyja és a többi tevékenységet más speciális összetevőkhöz továbbítják.

Például: ha videót akarunk kódolni egy x86-os processzoron, akkor abban segítségünkre van egy utasításkészlet (az Intel úgynevezett Quick Sync technológiája). De ugyanazon a CPU-n belüli utasítások, ezért a munka felszabadítása helyett betöltik ezt a munkát. Az Apple A12 processzornak azonban van egy HEVC videokódoló magja, amely kívül esik a CPU-n, és amelynek feladata a videó kódolása és dekódolása ezzel a kodekkel. Tehát, ha 4K videót rögzítünk egy iPhone XR-re (például), a CPU-nak semmit sem kell tennie, kivéve a műveletek koordinálását, míg a kódolás terhe egy külső összetevőt terhel. Ez nyilvánvalóan felszabadítja a CPU-t más dolgok elvégzésére, elterjeszti a munkát és gyorsabbá teszi a rendszert a valós használat során.

Gondoljon most arra, hogy az A12 CPU a következő összetevőket tartalmazza: GPU (grafikus processzor), TPU (tenzorok vagy idegmotorok egysége), folyamatkoordinátor (amely meghatározza, hogy a számítógéptől kért egyes műveleteknek milyen típusú magot vagy alkatrészt kell chipre menniük. ), ISP (képfeldolgozó chip fényképezéshez), DSP (vagy digitális jelfeldolgozó hanghoz), mélységmotor (a képen lévő elemek mélységének feldolgozásához), videoprocesszor ... plusz a GPU-nak 4 magja van (7 A12x esetén) és 6 CPU-magja (8 A12x esetén).