Sima Dezső Többmagos/sokmagos processzorok-1 2012. Október Version 3.0.

Slides:



Advertisements
Hasonló előadás
A processzorok rövid történelme, áttekintése
Advertisements

A processzorok rövid története, áttekintése, újdonságai
1 Számítógépek felépítése 9. előadás I/O rendszerek.
Mintacím szerkesztése •Mintaszöveg szerkesztése •Második szint •Harmadik szint •Negyedik szint •Ötödik szint D modelling in the terrestrial.
… with NFC A mobil contactless (NFC) technológia lehetőségei a pénzügyi szektorban.
2 Forrás: The Standish Group International, Extreme Chaos, The Standish Group International, Inc., 2000.
Számold meg a fekete pontokat!
Számítógép architektúra
Windows Server Hyper-V R2 SP1 újdongságok
ATMEL AVR mikrokontroller család hardver-felépítése
A többmagos processzorok
A Processzor foglalata
Informatikai alapismeretek
Villamos és hibrid kishaszonjárművek hajtás problémái
Paradigmaváltások a processzorfejlesztésben Sima Dezső augusztus 25.
3. Szálszinten párhuzamos feldolgozás (TLP)
Sima Dezső Többmagos/sokmagos processzorok December Version 1.2.
Sima Dezső Többmagos/sokmagos processzorok Október Version 3.0.
Többmagos/sokmagos processzorok-2
Korszakváltás a processzorok fejlődésében Sima Dezső 2011 őszi félév.
Korszakváltás a processzorok fejlődésében Sima Dezső 2007 őszi félév.
Korszakváltás a processzorok fejlődésében Sima Dezső 2009 őszi félév.
Sima Dezső Többmagos/sokmagos processzorok ősz.
Többmagos processzorok
Szabados Lajos – SZLSABI.ELTE 20. csoport.  Az órajel további növelése nehézkessé vált  Nyomás érkezett a fejlesztők felöl is.
Tematikus fogalomtár FÉLVEZETŐS TÁRAK
Determinisztikus vonások a mikroprocesszorok fejlődésében Sima Dezső május 27.
Paradigmaváltások a processzorfejlesztésben Sima Dezső augusztus 25.
Korszakváltás a processzorok fejlődésében Sima Dezső Szeptember.
Az ILP feldolgozás fejlődése
Mikrokontroller (MCU, mikroC)
A Dublin-i Future Internet Assembly üzenetei Sallai Gyula, Vilmos András Jövő Internet Kutatáskoordinációs Központ Budapest, június 4.
Budapesti Műszaki és Gazdaságtudományi Egyetem Elektronikus Eszközök Tanszéke MIKROELEKTRONIKA, VIEEA306 Integrált áramkörök: áttekintés,
IC gyártás Új technológiák. 2 Strained Silicon (laza szilícium)
Processzorok.
Web Architecture. Development of Computing Architectures Monolithic mainframe programming Client Server Real Client Server Web Programming.
Magas rendelkezésre állású Hyper-V rendszer építése
PPKE ITK 2009/10 tanév 8. félév (tavaszi) Távközlő rendszerek forgalmi elemzése Tájékoztatás
Óravázlat Készítette: Kucsera Mihály 2011.
A többmagos processzorok világa Páter-Részeg Attila (PAASABI.ELTE) Beadandó I.
Ismerkedjünk tovább a számítógéppel
A számítógépek története
1 Számítógépek felépítése 13. előadás Dr. Istenes Zoltán ELTE-TTK.
Vállalati infrastruktúra, mely minden igényt kielégít Felhasználóbarát eszközök és élmények.
4/1/2015 Cloud computing Dr. Bakonyi Péter.. 4/1/2015Cloud computing 2 Cloud definició A cloud vagy felhő egy platform vagy infrastruktúra Az alkalmazások.
Mikroprocesszorok (Microprocessors, CPU-s)
ifin811/ea1 C Programozás: Hardver alapok áttekintése
Intel P965 chipset.
A processzorok (CPU).
Többmagos/sokmagos processzorok-2
Virul az ISO szabványcsalád
A CPU (központi feldolgozó egység vagy processzor)
Kiss Zoltán NIIF Intézet Networkshop 2016 HPC Tutoriál Az (NIIF) HPC bemutatása.
Mikrorendszerek felépítésének általános modellje Fehér Béla.
CPU (Processzor) A CPU (Central Processing Unit – Központi Feldolgozó Egység) a számítógép azon egysége, amely értelmezi az utasításokat és vezérli.
Farkas Bálint | Technical Evangelist | Microsoft
A Büntetés-végrehajtási Szervezet helyzete és aktuális feladatai
Délkelet-Európai HPC Projekt
<Fejléc - Előadás címe>
Ilyen számitógépet szeretnék.
XDSL hálózatok tervezése 9. Előadás
Kutatási célú szakmai ösztöndíj beszámoló
Inverter applications
Az ILP feldolgozás fejlődése
Microsoft SQL licenselés a gyakorlatban
Korszakváltás a processzorok fejlődésében
Business Intelligence (Üzleti Intelligencia)
Mikrofonok Principles, constructions, characteristics and applications
Számold meg a fekete pontokat!
TELE-OPERATOR® UTS v.18 Mobil internet szolgáltatások hálózatsemlegességét ellenőrző mérőrendszer működése Gyártó: COMPU-CONSULT Kft. Ügyvezető: dr.
Előadás másolata:

Sima Dezső Többmagos/sokmagos processzorok Október Version 3.0

Áttekintés 1. Többmagos processzorok megjelenésének szükségszerűsége 2. Homogén többmagos processzorok 3. Heterogén többmagos processzorok 2.1 Hagyományos többmagos processzorok 3.1 Mester/szolga elvű többmagos processzorok 3.2 Csatolt többmagos processzorok 4. Kitekintés 2.2 Sokmagos processzorok

1. Többmagos processzorok megjelenésének szükségszerűsége

1.1 ábra: Az integrált áramkörök gyártási technológiájának fejlődése 1. Többmagos processzorok megjelenésének szükségszerűsége (1) Shrinking: ~ 0.7/2 Years

1. Többmagos processzorok megjelenésének szükségszerűsége (2) IC gyártási technológia Moore szabály azonos tranzisztorszám ½ Si területen (Jelenleg: lineáris zsugorítás ~ 0.7x/2 év) azonos területen 2x annyi tranzisztor Két évente Kétévente kb. duplázódik az egy lapkán megvalósítható ltranzisztorok száma

Possible use of surplus transistors Wider processor widthCore enhancementsCache enhancements superscalar branch prediction speculative loads... L2/L3 enhancements (size, associativity...) 1. Gen.2. Gen pipeline A tranzisztorszámok duplázódása ~ két évente Mire használhatók fel a többlet-tranzisztorok a mikroarchitektúra fejlesztésében? Moore szabály 1. Többmagos processzorok megjelenésének szükségszerűsége (3)

A többlet tranzisztorok felhasználása többmagos processzorként A többmagos processzorok megjelenésének szükségszerűsége Növekvő tranzisztorszámok Egyre csökkenő teljesítményhozam 1. Többmagos processzorok megjelenésének szükségszerűsége (4)

1.3 ábra: Intel többmagos processzorainak robbanásszerű elterjedése 1. Többmagos processzorok megjelenésének szükségszerűsége (5)

1. Többmagos processzorok megjelenésének szükségszerűsége (7) 1.4 ábra: Többmagos processzorok főbb osztályai Desktops Heterogenous multicores Homogenous multicores Multicore processors Manycore processors Servers with >8 cores Conventional MC processors Master/slave architectures Add-on architectures MPC CPU GPU 2 ≤ n ≤ 8 cores General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future

2. Homogén többmagos processzorok

2. Homogén többmagos procdesszorok (1) 2.1 ábra: Többmagos processzorok főbb osztályai Desktops Heterogenous multicores Homogenous multicores Multicore processors Manycore processors Servers with >8 cores Conventional MC processors Master/slave architectures Add-on architectures MPC CPU GPU 2 ≤ n ≤ 8 cores General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future

2.8 ábra: Többmagos processzorok főbb osztályai Desktops Heterogenous multicores Homogenous multicores Multicore processors Manycore processors Servers with >8 cores Conventional MC processors Master/slave architectures Add-on architectures MPC CPU GPU 2 ≤ n ≤ 8 cores General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future 2.2 Sokmagos processzorok (1)

2.2 Sokmagos processzorok Intel Tiled processszora Intel Larrabee processzora Intel SCC Intel MIC

2.2.1 Intel Larrabee processzora Intel Larrabee processzora (1)

Larrabee Intel’s Tera-Scale kezdeményezésének részeként. Projekt kezdete ~ 2005 Az első nem nyilvános prezentáció: 03/2006 (visszavonva) Az első nyilvános prezentáció: 08/2008 (SIGGRAPH) Bejelentett megjelenés ~ 2009 Visszavonás: 2010 vége Teljesítmény (cél): 2 TFlops Előzmények: Célok: Nem egyetlen termék, hanem egy termékcsalád alapjául szolgáló bázis architektúra. Nagyteljesítményű grafikai processzor, HPC Intel Larrabee processzora (2)

2.9 ábra: A GPU-orientált Larrabe blokk diagramja (2008 aug. SIGGRAPH) Basic architecture 16-byte széles SIMD feldolgozó egységek Intel Larrabee processzora (3)

2.10 ábra: GPU-orientált Larrabee alaplapja (2006, túlhaladott) Intel Larrabee processzora (4) Multi GPU?

2.11 ábra: Négyfoglalatos MP szerver célú Larrabee rendszer architektúrája CSI: Common Systems Interface (csomagalapú soros IF) Intel Larrabee processzora (5)

5. hét ( ) - Ismétlés fejezetű diát visszaidézve: 8. epic statikus függőségfeloldás, egyszerűbb rendszer, mert ez a feladat át van hárítva a compilerre, így igen összetett compilerek kellenek. HP+Intel=> VLIW+szupskalár óta fejlesztések=EPIC Nagy csalódás, hatékonyság nem volt jobb mint a pentium rendszereké, később javítottak kicsit, de ez se menthette már meg, ez is kevés volt. EPIC halott-> többmagosak Évről évre nő a tranók száma → értelmes felhasználás a több mag. 1 év alatt minden kategória mobil->szerve átált többmagosra. Többmagos felosztása: Homogén: azonos magok, Hom manycore kísérleti terep. heterogén: eltérő magok Mester/szolga elv. → komplex szervezés pl. PS3 Csatolt rendszerek: CPU+GPU ha valamit egy gyorsító jobban tud, annak azt átadja.

5. hét ( ) - Ismétlés Sokmagos rendszerek Intel Larrabee Szép feléptíés: rendszerelemek (procik, memóriavezérlők, gyorsítók (pl. gpu) egy körgyűrűs adatkapcsolas, 2 vagy 2x2 csilével, megcímzett adatok akinek szól az átveszi. 2009ben lezárult Sandy Bridge is ezt (a rendszert) használja.

2.2.2 Intel 80-magos Tile processzora

Intel Tera-Scale kezdeményezésének első megvalósítása Bejelentése IDF 9/2006 Megjelenése 2/2007 Cél: Tera-Scale kísérleti chip (több, mint 100 projekt között) Előzmények: 80-magos Tile Processzor Intel 80-magos Tile processzora (1)

Intel Bisection bandwidth: If the network is segmented into two equal parts, this is the bandwidth between the two parts Mezosynchronous clock Same clock frequency, different phase Intel 80-magos Tile processzora (2)

Intel Intel 80-magos Tile processzora (3)

Intel (Clocks run with the same frequency but unknown phases FP Multiply-Accumulate (AxB+C) Intel 80-magos Tile processzora (4)

Figure: On board implementation of the 80-core Tile Processor Intel 80-magos Tile processzora (5)

Intel WIMP stands for "window, icon, menu, pointing device",windowiconmenupointing device Intel 80-magos Tile processzora (6)

Intel Intel 80-magos Tile processzora (7)

Intel VLIW Intel 80-magos Tile processzora (8)

Intel Intel 80-magos Tile processzora (9)

Intel Intel 80-magos Tile processzora (10) (Pentium II)

Intel NoC: No Cache Intel 80-magos Tile processzora (11)

Intel Intel 80-magos Tile processzora (12)

2.2.3 Intel SCC (Single-chip Cloud Computer)

12/2009: Announced 9/2010: Many-core Application Research Project (MARC) initiative started on the SCC platform Designed in Braunschweig and Bangalore 48 core, 2D-mesh system topology, message passing Intel SCC (Single-chip Cloud Computer) Intel SCC (Single-chip Cloud Computer) (1)

Intel Intel SCC (Single-chip Cloud Computer) (2)

Intel (350 nm) Intel SCC (Single-chip Cloud Computer) (3)

Intel (Joint Test Action Group) Standard Test Access Port Intel SCC (Single-chip Cloud Computer) (4)

Intel Intel SCC (Single-chip Cloud Computer) (5)

Intel SCC (Single-chip Cloud Computer) (6)

Intel SCC (Single-chip Cloud Computer) (7)

Intel Intel SCC (Single-chip Cloud Computer) (8)

Intel (Message Passing Buffer) Intel SCC (Single-chip Cloud Computer) (9)

2.2.4 Intel MIC (Many Integrated Cores) - Xeon Phi (Knights Corner)

2.2.4 Intel MIC (Many Integrated Cores) (1) A Larrabee projekt továbbfejlesztése Cél: Adatpárhuzamos gyorsító (GPGPU-k “kiszorítására”) Bejelentés: 5/2010 (International Supercomputing Conference) Gyártás: 2012 vége 50 mag, 22 nm Bevezetés

Intel MIC (Many Integrated Cores) (2)

Intel MIC (Many Integrated Cores) (3)

G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips Intel MIC (Many Integrated Cores) (4)

G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips Intel MIC (Many Integrated Cores) (5)

G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips Intel MIC (Many Integrated Cores) (6)

G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips Intel MIC (Many Integrated Cores) (7)

G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips 2012 Heavily customized Pentium P54C Intel MIC (Many Integrated Cores) (8)

Intel MIC (Many Integrated Cores) (9)