Sima Dezső Többmagos/sokmagos processzorok Október Version 3.0
Áttekintés 1. Többmagos processzorok megjelenésének szükségszerűsége 2. Homogén többmagos processzorok 3. Heterogén többmagos processzorok 2.1 Hagyományos többmagos processzorok 3.1 Mester/szolga elvű többmagos processzorok 3.2 Csatolt többmagos processzorok 4. Kitekintés 2.2 Sokmagos processzorok
1. Többmagos processzorok megjelenésének szükségszerűsége
1.1 ábra: Az integrált áramkörök gyártási technológiájának fejlődése 1. Többmagos processzorok megjelenésének szükségszerűsége (1) Shrinking: ~ 0.7/2 Years
1. Többmagos processzorok megjelenésének szükségszerűsége (2) IC gyártási technológia Moore szabály azonos tranzisztorszám ½ Si területen (Jelenleg: lineáris zsugorítás ~ 0.7x/2 év) azonos területen 2x annyi tranzisztor Két évente Kétévente kb. duplázódik az egy lapkán megvalósítható ltranzisztorok száma
Possible use of surplus transistors Wider processor widthCore enhancementsCache enhancements superscalar branch prediction speculative loads... L2/L3 enhancements (size, associativity...) 1. Gen.2. Gen pipeline A tranzisztorszámok duplázódása ~ két évente Mire használhatók fel a többlet-tranzisztorok a mikroarchitektúra fejlesztésében? Moore szabály 1. Többmagos processzorok megjelenésének szükségszerűsége (3)
A többlet tranzisztorok felhasználása többmagos processzorként A többmagos processzorok megjelenésének szükségszerűsége Növekvő tranzisztorszámok Egyre csökkenő teljesítményhozam 1. Többmagos processzorok megjelenésének szükségszerűsége (4)
1.3 ábra: Intel többmagos processzorainak robbanásszerű elterjedése 1. Többmagos processzorok megjelenésének szükségszerűsége (5)
1. Többmagos processzorok megjelenésének szükségszerűsége (7) 1.4 ábra: Többmagos processzorok főbb osztályai Desktops Heterogenous multicores Homogenous multicores Multicore processors Manycore processors Servers with >8 cores Conventional MC processors Master/slave architectures Add-on architectures MPC CPU GPU 2 ≤ n ≤ 8 cores General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future
2. Homogén többmagos processzorok
2. Homogén többmagos procdesszorok (1) 2.1 ábra: Többmagos processzorok főbb osztályai Desktops Heterogenous multicores Homogenous multicores Multicore processors Manycore processors Servers with >8 cores Conventional MC processors Master/slave architectures Add-on architectures MPC CPU GPU 2 ≤ n ≤ 8 cores General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future
2.8 ábra: Többmagos processzorok főbb osztályai Desktops Heterogenous multicores Homogenous multicores Multicore processors Manycore processors Servers with >8 cores Conventional MC processors Master/slave architectures Add-on architectures MPC CPU GPU 2 ≤ n ≤ 8 cores General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future 2.2 Sokmagos processzorok (1)
2.2 Sokmagos processzorok Intel Tiled processszora Intel Larrabee processzora Intel SCC Intel MIC
2.2.1 Intel Larrabee processzora Intel Larrabee processzora (1)
Larrabee Intel’s Tera-Scale kezdeményezésének részeként. Projekt kezdete ~ 2005 Az első nem nyilvános prezentáció: 03/2006 (visszavonva) Az első nyilvános prezentáció: 08/2008 (SIGGRAPH) Bejelentett megjelenés ~ 2009 Visszavonás: 2010 vége Teljesítmény (cél): 2 TFlops Előzmények: Célok: Nem egyetlen termék, hanem egy termékcsalád alapjául szolgáló bázis architektúra. Nagyteljesítményű grafikai processzor, HPC Intel Larrabee processzora (2)
2.9 ábra: A GPU-orientált Larrabe blokk diagramja (2008 aug. SIGGRAPH) Basic architecture 16-byte széles SIMD feldolgozó egységek Intel Larrabee processzora (3)
2.10 ábra: GPU-orientált Larrabee alaplapja (2006, túlhaladott) Intel Larrabee processzora (4) Multi GPU?
2.11 ábra: Négyfoglalatos MP szerver célú Larrabee rendszer architektúrája CSI: Common Systems Interface (csomagalapú soros IF) Intel Larrabee processzora (5)
5. hét ( ) - Ismétlés fejezetű diát visszaidézve: 8. epic statikus függőségfeloldás, egyszerűbb rendszer, mert ez a feladat át van hárítva a compilerre, így igen összetett compilerek kellenek. HP+Intel=> VLIW+szupskalár óta fejlesztések=EPIC Nagy csalódás, hatékonyság nem volt jobb mint a pentium rendszereké, később javítottak kicsit, de ez se menthette már meg, ez is kevés volt. EPIC halott-> többmagosak Évről évre nő a tranók száma → értelmes felhasználás a több mag. 1 év alatt minden kategória mobil->szerve átált többmagosra. Többmagos felosztása: Homogén: azonos magok, Hom manycore kísérleti terep. heterogén: eltérő magok Mester/szolga elv. → komplex szervezés pl. PS3 Csatolt rendszerek: CPU+GPU ha valamit egy gyorsító jobban tud, annak azt átadja.
5. hét ( ) - Ismétlés Sokmagos rendszerek Intel Larrabee Szép feléptíés: rendszerelemek (procik, memóriavezérlők, gyorsítók (pl. gpu) egy körgyűrűs adatkapcsolas, 2 vagy 2x2 csilével, megcímzett adatok akinek szól az átveszi. 2009ben lezárult Sandy Bridge is ezt (a rendszert) használja.
2.2.2 Intel 80-magos Tile processzora
Intel Tera-Scale kezdeményezésének első megvalósítása Bejelentése IDF 9/2006 Megjelenése 2/2007 Cél: Tera-Scale kísérleti chip (több, mint 100 projekt között) Előzmények: 80-magos Tile Processzor Intel 80-magos Tile processzora (1)
Intel Bisection bandwidth: If the network is segmented into two equal parts, this is the bandwidth between the two parts Mezosynchronous clock Same clock frequency, different phase Intel 80-magos Tile processzora (2)
Intel Intel 80-magos Tile processzora (3)
Intel (Clocks run with the same frequency but unknown phases FP Multiply-Accumulate (AxB+C) Intel 80-magos Tile processzora (4)
Figure: On board implementation of the 80-core Tile Processor Intel 80-magos Tile processzora (5)
Intel WIMP stands for "window, icon, menu, pointing device",windowiconmenupointing device Intel 80-magos Tile processzora (6)
Intel Intel 80-magos Tile processzora (7)
Intel VLIW Intel 80-magos Tile processzora (8)
Intel Intel 80-magos Tile processzora (9)
Intel Intel 80-magos Tile processzora (10) (Pentium II)
Intel NoC: No Cache Intel 80-magos Tile processzora (11)
Intel Intel 80-magos Tile processzora (12)
2.2.3 Intel SCC (Single-chip Cloud Computer)
12/2009: Announced 9/2010: Many-core Application Research Project (MARC) initiative started on the SCC platform Designed in Braunschweig and Bangalore 48 core, 2D-mesh system topology, message passing Intel SCC (Single-chip Cloud Computer) Intel SCC (Single-chip Cloud Computer) (1)
Intel Intel SCC (Single-chip Cloud Computer) (2)
Intel (350 nm) Intel SCC (Single-chip Cloud Computer) (3)
Intel (Joint Test Action Group) Standard Test Access Port Intel SCC (Single-chip Cloud Computer) (4)
Intel Intel SCC (Single-chip Cloud Computer) (5)
Intel SCC (Single-chip Cloud Computer) (6)
Intel SCC (Single-chip Cloud Computer) (7)
Intel Intel SCC (Single-chip Cloud Computer) (8)
Intel (Message Passing Buffer) Intel SCC (Single-chip Cloud Computer) (9)
2.2.4 Intel MIC (Many Integrated Cores) - Xeon Phi (Knights Corner)
2.2.4 Intel MIC (Many Integrated Cores) (1) A Larrabee projekt továbbfejlesztése Cél: Adatpárhuzamos gyorsító (GPGPU-k “kiszorítására”) Bejelentés: 5/2010 (International Supercomputing Conference) Gyártás: 2012 vége 50 mag, 22 nm Bevezetés
Intel MIC (Many Integrated Cores) (2)
Intel MIC (Many Integrated Cores) (3)
G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips Intel MIC (Many Integrated Cores) (4)
G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips Intel MIC (Many Integrated Cores) (5)
G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips Intel MIC (Many Integrated Cores) (6)
G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips Intel MIC (Many Integrated Cores) (7)
G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips 2012 Heavily customized Pentium P54C Intel MIC (Many Integrated Cores) (8)
Intel MIC (Many Integrated Cores) (9)