Sima Dezső Többmagos/sokmagos processzorok-2 2012. Október Version 1.0.

Slides:



Advertisements
Hasonló előadás
Getting started with intercultural dialogue - perspectives from HungaryAvviare il dialogo interculturale – prospettive nei musei ungheresiGetting started.
Advertisements

Eisenbahn-Unfalluntersuchungsstelle des Bundes KBSZ Szakmai találkozó Siófok, október 8. Bundesministerium für Verkehr, Bau- und Stadtentwicklung.
Bevezető Innovációs területek S+S Epilógus. pptPlex Section Divider Bevezető The slides after this divider will be grouped into a section and given the.
Merényi Ádám Microsoft Magyarország
„Esélyteremtés és értékalakulás” Konferencia Megyeháza Kaposvár, 2009
Energia – történelem - társadalom
Mobile Voice Communication Project Review •Cooperating partners: Cisco and T- Mobile, HTTP Foundation •Aim: new course on Cisco WLAN and Mobile.
English version A sablon nyelvének választása: /Format/Slide Design /majd jobb oldalt válaszd a másik be- ágyazott sablont! Projekt logó beállítása: /View/Master.
Az Intel® Xeon® processzor 5500 sorozat
IP addressing Számítógép networkok gyakorlata ÓBUDAI EGYETEM 2011 TAVASZI FÉLÉV 3. LABORGYAKORLAT PRÉM DÁNIEL.
Tester Developer Architect Project Manager Business Analyst Designer Database Professional.
Nyereményjátékok és a Facebook - aki mer, az nyer!?”
"Shoes on the Danube Bank” "נעליים בטיילת הדנובה"
2 3.NET Framework 3.0 Visual Studio Extensions for WF Visual Studio Extensions for WCF/WPF CTP ASP.NET AJAX 1.0 Ajax Toolkit.NET Framework 3.5 Visual.
21 Years of Partnership and Innovation 1989 Citrix Systems founded 2010 Citrix signed licensing agreement with Microsoft for NT Server Introduced Independent.
2 8 Kiadás éve / Platform Server (1000’s of users) Workgroup (Dozens of users) Desktop (Single User) Laptop Tablet PC Windows CE.
Optikai sugázrás hatása az emberi bőrre és szemre
What is the Mission Situation in Hungary?. Dr. György KOVÁCS What Is The Mission Situation In Hungary? Presentation Design by Ed Nickle – United World.
„ Bottom-up” cluster development and cooperation in Hungary Hungarian Confederation of Clusters and Networks Conference on cluster-cooperation in the V4.
The role of ARC in scaling up the Hungarian NGI Péter Stefán NIIFI NorduGrid 2011 May 9-12 Sundvolden, Norway.
ENEREA - Észak –Alföld Regional Energy Agency Gábor Vámosi Managing director.
Busch-Hungária Kft. Overview.
Bevezetés a tárgyakhoz Tárgyak  Objects are the containers for values of a specified type  Objects are either signals, variables or constants  Once.
FelültöltésVHDL Felültöltés (Overloading) n Áttekintés n Példák.
Kortárs diagnózisok helyzetfelmérés.
A többmagos processzorok
„21. századi közoktatás – fejlesztés, koordináció” TÁMOP / számú kiemelt projekt eTwinning: a digital touch in teacher training Klaudia.
Az erőátviteli rendszer
Infokommunikációs rendszerek 12
Infokom. rendsz. 11. előadás nov Kommunikációs rendszerek alapjai 11. előadás Rádiós adathálózatok Bluetooth, ZigBee, WiFi, WiMAX, Takács.
Infokommunikációs rendszerek 11
Course Situation and Event Driven Models for Multilevel Abstraction Based Virtual Engineering Spaces Óbuda University John von Neumann Faculty of Informatics.
Sima Dezső Többmagos/sokmagos processzorok December Version 1.2.
Sima Dezső Többmagos/sokmagos processzorok Október Version 3.0.
Többmagos/sokmagos processzorok-2
Sima Dezső Többmagos/sokmagos processzorok ősz.
KÖZÉP-ÁZSIA:A GREAT GAME- MASODIK FELVONÁS Tamás Pál MTA SZKI.
Építészet és kritika Weblap bemutatása, Tóth Enikő.
Elektroanalitikához segédábrák Az ábrák több, részben szerzői jogokkal védett műből, oktatási célra lettek kivéve. Csak az intranetre tehetők, továbbmásolásuk,
Szervező program Pénzügy figyelő, számlázó program Legújabb alkalmazás.NET Framework 2.0 WSE.NET Framework 4.0 WCF Régebbi, jól bevált alkalmazás.
Egy GAZDAG HIBAJELENTÉS elég információt tartalmaz ahhoz, hogy AZONNALI LÉPÉSEKET lehessen tenni, a javítás érdekében.
Kajcsos Zsolt MTA KFKI Részecske-és Magfizikai Kutató Intézet Nagyspinű és kisspinű állapotok tanulmányozása pozitrónium kölcsönhatások által.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks P-GRADE Portal gyakorlat ismertető Gergely.
Hasznos ismeretek Hogyan bővítsük ismereteinket AVRDUDEflags -E noreset.
2 Plug-in nélkül: AJAX 130+ eszközkészlet: megvásárolható, ingyenes és/vagy nyílt/megosztott forrású a webes megoldásszállítók saját, belső megoldásai.
Confidential All Rights reserved. © Chemistry Logic Ltd mag egy chip-en? Újrakonfigurálható rendszereken mindez ma lehetséges. Bérces Attila,
Teachers as key stakeholders of ICT in Hungarian schools Andrea Karpati, Eotvos University, Budapest
Tanulni, tanulni, tanulni Értékesítői képességek, a személyzet képzése.
Könyvtár, csomag és alprogramokVHDL Könyvtár, csomag és alprogram n Library és use n Package n Alprogramok –Procedure –Function –Resolution function Egy.
Budapesti Műszaki és Gazdaságtudományi Egyetem Elektronikus Eszközök Tanszéke MIKROELEKTRONIKA, VIEEA306 Integrált áramkörök: áttekintés,
Budapesti Műszaki és Gazdaságtudomanyi Egyetem Elektronikus Eszközök Tanszéke 1 Tokozások termikus tesztje, minősítése.
IC gyártás Új technológiák. 2 Strained Silicon (laza szilícium)
Készült az ERFP – DD2002 – HU – B – 01 szerzősésszámú projekt támogatásával Chapter 1 / 1 C h a p t e r 1 Introduction.
A magyar nyelv nagyszótára ‘Comprehensive Dictionary of Hungarian’ (Dictionary of the Academy) A brief history Tamás Péter Szabó Department of Lexicography.
- Group Policy - Group Policy Preferences - Group Policy 4x5 - Optimális munkakörnyezet – az első lépcsőfok.
A sablon nyelvének választása: /Format/Slide Design /majd jobb oldalt válaszd a másik be- ágyazott sablont! Projekt logó beállítása: /View/Master /Slide.
TALÁLTAM EGY OLDALT AHOL EZEKET A “TOJÁSOKAT” LEHET LÁTNI. NAGY MÛVÉSZNEK KELLET LENNI, HOGY ILYEN SZÉPEN TUDTA FORMÁZNI A TOJÁSOK HÉJÁT, DE SZERINTEM.
P árhuzamos és Elosztott Rendszerek Operációs Rendszerei Rövid András
Web Application 1 Web Application 3 Web Application 2 Web Application 4 Shared Service Provider 1 Shared Service Provider 2 Excel Services1 Search1.
Fej irányultságának becslése Ügyféltérben gyanús viselkedés jelzéséhez Kültéren kiegészítő hő szenzor szükséges.
MG/MAG eljárásváltozatok CLOOS-ÓE Bánki Szimpózium 2014 MIG/MAG eljárásváltozatok Kristóf Csaba (MAHEG)
Mikroprocesszorok (Microprocessors, CPU-s)
Többmagos/sokmagos processzorok-2
Sima Dezső Többmagos/sokmagos processzorok Október Version 3.0.
Kiss Tibor System Administrator (MCP) ISA Server 2006.
Systems Hardware Business challenge
Nokia C5 Data Sheet Planned Market Introduction • Q Category
TECHNICAL TRAINING December 2012.
Antibiotic Drug Prescription
Major Academic Plan (MAP)
Előadás másolata:

Sima Dezső Többmagos/sokmagos processzorok Október Version 1.0

Áttekintés 1. Többmagos processzorok megjelenésének szükségszerűsége 2. Homogén többmagos processzorok 3. Heterogén többmagos processzorok 2.1 Hagyományos többmagos processzorok 3.1 Mester/szolga elvű többmagos processzorok 3.2 Csatolt többmagos processzorok 4. Kitekintés 2.2 Sokmagos processzorok

3. Heterogén többmagos processzorok

3.1 Heterogén mester/szolga elvű többmagos processzorok (1) 3.1 ábra Többmagos processzorok főbb osztályai Desktops Heterogenous multicores Homogenous multicores Multicore processors Manycore processors Servers with >8 cores Conventional MC processors Master/slave architectures Add-on architectures MPC CPU GPU 2 ≤ n ≤ 8 cores General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future

3. Heterogén többmagos processzorok 3.1 Heterogén többmagos mester/szolga elvű TP-ok A Cell processzor

3.1 Heterogén mester/szolga elvű TP-ok - A Cell (1) Cell BE Előzmények: 2000 nyara:Az architektúra alapjainak meghatározása 02/2006: Cell Blade QS20 08/ 2007 Cell Blade QS21 05/ 2008 Cell Blade QS22 Sony, IBM és Toshiba közös terméke Cél: Játékok/multimédia, HPC alkalmazások Playstation 3 (PS3) QS2x Blade Szerver család (2 Cell BE/blade)

EIB: Element Interface Bus 3.2 ábra: A Cell BE blokk diagramja SPE: Synergistic Procesing Element SPU: Synergistic Processor Unit SXU: Synergistic Execution Unit LS: Local Store of 256 KB SMF: Synergistic Mem. Flow Unit PPE: Power Processing Element PPU: Power Processing Unit PXU: POWER Execution Unit MIC: Memory Interface Contr. BIC: Bus Interface Contr. XDR: Rambus DRAM 3.1 Heterogén mester/szolga elvű TP-ok - A Cell (2)

3.3 ábra: A Cell BE lapka (221mm 2, 234 mtrs) 3.1 Heterogén mester/szolga elvű TP-ok - A Cell (3)

3.10 ábra: A Cell BE lapka - EIB 3.1 Heterogén mester/szolga elvű TP-ok - A Cell (4)

3.11 ábra: Az EIB működési elve 3.1 Heterogén mester/szolga elvű TP-ok - A Cell (5)

3.12 ábra: Konkurens átvitelek az EIB-en 3.1 Heterogén mester/szolga elvű TP-ok - A Cell (6)

3.2 GHz: QS21 Csúcs SP FP: 409,6 GFlops (3.2 GHz x 2x8 SPE x 2x4 SP FP/cycle) Cell BE - NIK 2007: Faculty Award (Cell 3Đ app./Teaching) 2008: IBM – NIK Kutatási Együttműködési Szerződés: Teljesítményvizsgálatok IBM Böblingen Lab IBM Austin Lab 3.1 Heterogén mester/szolga elvű TP-ok - A Cell (7)

The Roadrunner 6/2008 : International Supercomputing Conference, Dresden A világ 500 leggyorsabb számítógépe 1. Roadrunner 1 Petaflops (10 15 ) fenntartott teljesítmény (linpack) 3.1 Heterogén mester/szolga elvű TP-ok - A Cell (8)

3.13 ábra:A világ leggyorsabb számítógépe: IBM Roadrunner (Los Alamos 2008) 3.1 Heterogén mester/szolga elvű TP-ok - A Cell (9)

3.14 ábra: A Roadrunner főbb jellemzői 3.1 Heterogén mester/szolga elvű TP-ok - A Cell (10)

EIB: Element Interface Bus 3.2 ábra: A Cell BE blokk diagramja SPE: Synergistic Procesing Element SPU: Synergistic Processor Unit SXU: Synergistic Execution Unit LS: Local Store of 256 KB SMF: Synergistic Mem. Flow Unit PPE: Power Processing Element PPU: Power Processing Unit PXU: POWER Execution Unit MIC: Memory Interface Contr. BIC: Bus Interface Contr. XDR: Rambus DRAM 3.1 Heterogén mester/szolga elvű TP-ok - A Cell (2) Visszalapozott ehhez

3.15 ábra: Többmagos processzorok főbb jellemzői Desktops Heterogenous multicores Homogenous multicores Multicore processors Manycore processors Servers with >8 cores Conventional MC processors Master/slave architectures Add-on architectures MPC CPU GPU 2 ≤ n ≤ 8 cores General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future 3.2 Heterogén csatolt többmagos processzorok (1)

3.2 Heterogén csatolt többmagos processzorok

kernel0 >>() kernel1 >>() HostDevice Csatolt elvű végrehajtás elve GPGPU-k esetén (legegyszerűbb szervezést feltételezve) 3.2 Heterogén csatolt többmagos processzorok (1) (Adatpárh. progr.) CUDA

Heterogén csatolt többmagos processzorok feldolgozás gyorsítók (accelerators) A működési elv szempontjából előzmény: heterogén csatolt többprocesszoros rendszerek Példák: korai személyi számítógépek lebegőpontos társprocesszorokkal Intel Az Intel 486-nak már volt saját “on-chip” lebegőpontos egysége (FPU) (az SX és SL modelek kivételével) Megjegyzés a működési elvhez 3.2 Heterogén csatolt többmagos processzorok (2)

Heterogén csatolt többmagos processzorok legfontosabb implementációi Heterogén csatolt többmagos processzorok Integrált grafika Okostelefonok 3.2 Heterogén csatolt többmagos processzorok (3)

3.2.1 Integrált grafika

Integrált grafika (1) Áttérés angol nyelvű slide-ok használatára

Implementation of integrated graphics Implementations about In the north bridge On the processor die In a multi-chip processor package on a separate die Both the CPU and the GPU are on separate dies and are mounted into a single package P South Bridge Mem. NBIG South Bridge Mem. NB P GPU CPU Periph. Contr. Mem. CPU GPU P Intel’s Havendale (DT) and Auburndale (M) (scheduled for 1H/2009 but cancelled) Arrandale (DT, 1/2010) and Clarkdale (M, 1/2010) Implementation of integrated graphics Intel’s Sandy Bridge (1/2011) and Ivy Bridge (4/2012) AMD’s Bobcat-based APUs (M, 1/2011) Llano APUs (DT, 6/2011) Trinity APUs (DT, Q4/2012) Integrált grafika (2)

6. hét ( ) – ismétlés alma

Example 1: Intel’s Havendale (DT) and Auburndale (M) multi-chip CPU/GPU processor plans (scheduled for 1H/2009 but cancelled about 1/2009) [] Revealed in 9/2007. Both parts were based on the 2. gen. Nehalem (Lynnfield) architecture, as shown below. RS – Intel 2009 Desktop Platform Overview Sept DMI DDR3 Graphics DDR3 IMC PCI-E Power Thread 8M Core Thread Core Ibexpeak PCH PCIe, SATA, NVRAM, etc. Display Analog Digital I/O Control Processors I/O functions Same LGA 1160 platform Display Link DMI DDR3 Graphics MCP Processor Power 4M PCI-E DDR3 IMC GPU Thread Core SDVO, HDMI Display Port, DVI Ibexpeak PCH VGA PCIe, SATA, NVRAM, etc. Display Analog Digital I/O Control Processors I/O functions Schedule: 2H ’08 First Samples 1H ’09 Production TDP < 95 W No integrated graphics Lynnfield processor (Monolithic die) Havendale processor (Multi-chip package – MCP) Integrált grafika (3)

Example 2: Intel’s Westmere-EP based multi-chip CPU/GPU processors (2010)-1 [] IDF 2009 Integrált grafika (4)

Positioning Intel’s Westmere-EP based multi-chip Clarkdale (DT) and Arrandale (M) processors with in-package integrated graphics [] Integrált grafika (5)

Using single part PCH (Peripheral Control Hub) for Intel’s Westmere-EP based multi-chip CPU/GPU processors (2010) [] Integrált grafika (6)

Replacing integrated graphics (IGFX) from the north bridge to the processor [] (Dedicated graphics via graphics card) Integrált grafika (7)

Implementation of integrated graphics Implementations around In the north bridge On the processor die Intel’s Sandy Bridge (1/2011) and Ivy Bridge (4/2012) AMD’s Bobcat-based APUs (M, 1/2011) and Llano APUs (DT, 6/2011) Trinity APUs (DT, Q4/2012) In a multi-chip processor package on a separate die Both the CPU and the GPU are on separate dies and are mounted into a single package P South Bridge Mem. NBIG South Bridge Mem. NB P GPU CPU Periph. Contr. Mem. CPU GPU P Implementation of commercial graphics on the processor die Intel’s Havendale (DT) and Auburndale (M) (scheduled for 1H/2009 but cancelled) Arrandale (DT, 1/2010) and Clarkdale (M, 1/2010) Integrált grafika (8)

Key microarchitecture features of the Sandy Bridge vs the Nehalem Example 1: Intel’s Sandy Bridge with 6 Series PCH-1 [] []: Kahn O., Piazza T., Valentine B.: Technology Insight: Intel Next Generation Microarchitecture Codename Sandy Bridge, IDF 2010 extreme.pcgameshardware.de/.../281270d bonusmaterial-pc- games- hardware sf10_spcs001_100.pdf Integrált grafika (9)

32K L1D (3 clk) AVX 256 bit 4 Operands 256 KB L2 (9 clk) Hyperthreading AES Instr. VMX Unrestrict. 20 nm 2 / Core 256 KB L2 (9 clk) 256 KB L2 (9 clk) 256 KB L2 (9 clk) 256 KB L2 (9 clk) 256 KB L2 (9 clk) 256 KB L2 (9 clk) PCIe GHz (to L3 connected) 256 b/cycle Ring Architecture (25 clk) DDR Die plot of the 4C Sandy Bridge processor [] Sandy Bridge 4C 32 nm 995 mtrs/216 mm 2 ¼ MB L2/C 8 MB L3 []: Intel Sandy Bridge Review, Bit-tech, Jan , Integrált grafika (10)

Sandy Bridge desktop datasheet Core i3-21xx, 2C, 2/2011 Core i5-23xx/24xx/25xx, 4C, 1/2011 Core i7-26xx, 4C, 1/2011 Intel 6 series PCH 1 1 Except P67 that does not provide a display controller in the PCH Block diagram of Intel’s Sandy Bridge with 6 Series PCH-2 [] 1 Integrált grafika (11)

Key microarchitecture features of the Ivy Bridge vs the Sandy Bridge Example 2: Intel’s Ivy Bridge with 6 Series PCH-1 [] Integrált grafika (12)

Ivy Bridge-DT Sandy Bridge-DT 22 nm 1480 mtrs 160 mm 2 32 nm 995 mtrs 216 mm 2 Contrasting the die plots of Ivy Bridge vs Sandy Bridge (at the same feature size)-1 [] Integrált grafika (13)

Note In the Ivy Bridge Intel devoted much more emphasis to graphics processing than in the Sandy Bridge to compete with AMD’s graphics superiority. Contrasting the die plots of Ivy Bridge vs Sandy Bridge (at the same feature size)-2 [] Integrált grafika (14)

Example 3: AMD’s “Swift” Fusion APU plan (2009) Preliminaries In 10/2006 AMD acquired the graphics firm ATI and at the same day they announced that “AMD plans to create a new class of x86 processors that integrate the central processing unit (CPU) and graphics processing unit (GPU) at the silicon level, codenamed “Fusion [].” AMD Completes ATI Acquisition and Creates Processing Powerhouse SUNNYVALE, CALIF. -- October 25, AMD Remark Although in the above statement AMD designated the silicon level integration of the CPU and GPU as the Fusion initiative, in some other publications they call both the package level and the silicon level integration of the CPU and GPU as the Fusion technology, as shown in the next figure [b] Integrált grafika (15)

Extended interpretation of the term Fusion technology in some AMD publications [] Despite this disambiguation, subsequently AMD understood the term Fusion usually as the silicon level integration of the CPU and the GPU. AMD Torrenza and Fusion together, 22 March 2007 Integrált grafika (16)

In 12/2007 at their Financial Analyst Day AMD gave birth to a new term by designating their processors implementing the Fusion concept as APUs (Accelerated Processing Units). At the same time AMD announced their first APU family called the Swift family [] as well. Integrált grafika (17)

In 11/2008 again at their Financial Analyst Day AMD postponed the introduction of Fusion-based APU processors until the company transitions to the 32 nm technology [].. AMD Fusion now pushed back to 2011 By Joel Hruska | Published: November 14, 2008-Joel Hruska Integrált grafika (18)

This is a similar move as done by Intel with their 45 nm Havendale (DT) and Auburndale (M) in-package integrated multi-chip CPU+GPU projects. As leaked from industry sources in 1/2009 Intel canceled their 45 nm multi-chip processor plans in favor of 32-nm multi-chip processors to be introduced in Q1/2010 []. Remark Intel cans 45nm “Auburndale” and “Havendale” Fusion CPUs! Posted by: theovalich | January 31, 2009 Integrált grafika (19)

Example 4: AMD’s Piledriver-based Trinity desktop APU line (2012) Announced in 6/2012 Scheduled for Q4/2012 The Trinity APU is based on the Piledriver Compute Module, which is a redesign of the ill fated Bulldozer Compute Module. Integrált grafika (20)

The Piledriver Compute Module of Trinity [] Integrált grafika (21)

The Trinity APU die with the Piledriver cores [] Integrált grafika (22)

The Comal platform that incorporates the (Piledriver-based) Trinity APU and the A70M PCH [] Integrált grafika (23)

3.2.2 Okostelefonok

3.3.2 Okostelefonok (1) Smart phone platforms Example: Texas OMAP 5 (OMAP 5430)

3.3.2 Okostelefonok (2)

4. Kitekintés

4. Kitekintés (4) Kitekintés Heterogenous multicores Master/slave architectures Add-on architectures 4.3 ábra: Hetererogén többmagos processzorok várható fejlődése Több CPU Több gyorsító

Köszönöm a figyelmet!