Paradigmaváltások a processzorfejlesztésben Sima Dezső 2005. augusztus 25.

Slides:



Advertisements
Hasonló előadás
A processzorok rövid történelme, áttekintése
Advertisements

Alaplap.
64 bites architektúra, csapdák és átjárók Tóth Sándor Terméktámogatási tanácsadó.
1 Számítógépek felépítése 9. előadás I/O rendszerek.
A számítógép felépítése
A számítógép felépítése
Memória.
A mikroprocesszor 1. rész.
Számítógép architektúra
Processzorok.
 Többszálúság  Gyártási költségek  A modellnevek megváltoztatása  Processzor magok  Athlon és Phenom összehasonlítása.
A többmagos processzorok
A számítógép felépítése
A hardver és a személyi számítógép konfigurációja
Alaplapra integrált csatlakozók
Az alaplap funkcionális egységei
Mikroprocesszorok (CPU)
A Processzor foglalata
Alapfogalmak Adat: fogalmak, tények, jelenségek olyan formalizált ábrázolása, amely emberi vagy gépi értelmezésre, feldolgozásra, közlésre alkalmas. Információ:
A 2000-es év utáni processzorok jellemzői
Digitális rendszerek I. c
Paradigmaváltások a processzorfejlesztésben Sima Dezső augusztus 25.
3. Szálszinten párhuzamos feldolgozás (TLP)
Korszakváltás a processzorok fejlődésében Sima Dezső 2013 őszi félév (verzió 3.4)
Korszakváltás a processzorok fejlődésében Sima Dezső 2011 őszi félév (módosított, verzió 3)
Többmagos Processzorok (1) Sima Dezső 2008 őszi félév (Ver. 2.1)  Sima Dezső, 2008.
Korszakváltás a processzorok fejlődésében Sima Dezső 2011 őszi félév.
Korszakváltás a processzorok fejlődésében Sima Dezső 2007 őszi félév.
Korszakváltás a processzorok fejlődésében Sima Dezső 2009 őszi félév.
Korszakváltás a processzorok fejlődésében
CISC - RISC processzor jellemzők
Többmagos processzorok
Mikroprocesszorok. X86 – amit mi is használunk Eredetileg 16 bites CISC Először 8, 16, majd 32 bitesre bővítve IA32 néven Kívül CISC, belül RISC (Pentium.
Számítástechnika a KFKI AEKI-ben
MIÉRTEK A SZÁMÍTÁSTECHNIKÁBAN
Determinisztikus vonások a mikroprocesszorok fejlődésében Sima Dezső május 27.
Operációs Rendszerek II.
III. Többmagos Processzorok (1) Sima Dezső 2007 tavaszi félév (Ver. 2.0)  Sima Dezső, 2007.
Korszakváltás a processzorok fejlődésében Sima Dezső Szeptember.
Az ILP feldolgozás fejlődése
A számítógép teljesítménye
Processzorfoglalat.
Érettségi jelentkezések és érettségi eredmények 2008 Tanévnyitó értekezlet Érettségi jelentkezések - érettségi eredmények augusztus 29.
Processzorok.
1 Gyarapodó Köztársaság Növekvő gazdaság – csökkenő adók február 2.
A Neumann-elvek 3. ÓRA.
Alaplapra integrált csatlakozók
: M-3 épités: „Csináld magad” PCWEEK (orosz), М-3: первый компьютер “сделай сам” 1962: Ferrites operatív tároló: vásárlás Fejlesztés:
Processzorok és típusai
Többszálú Processzorok Sima Dezső 2008 őszi félév (Ver. 2.0)  Sima Dezső, 2007.
Írja fel a tizes számrendszerbeli
A projekt az Európai Unió társfinanszírozásával, az Európa terv keretében valósul meg. Számítógép- architektúrák dr. Kovács György DE AVK GAIT.
IT ALAPFOGALMAK HARDVER.
Mikroprocesszorok (Microprocessors, CPU-s)
Piramis klaszter rendszer
A projekt az Európai Unió társfinanszírozásával, az Európa terv keretében valósul meg. Számítógép- architektúrák dr. Kovács György DE AVK GAIT.
ifin811/ea1 C Programozás: Hardver alapok áttekintése
CISC-RISC processzor jellemzők Előadó: Thész Péter Programtervező informatikus hallgató Budapest,
A processzorok (CPU).
1 Számítógépek felépítése 5. előadás a CPU gyorsítása, pipeline, cache Dr. Istenes Zoltán ELTE-TTK.
Korszakváltás a processzorok fejlődésében Sima Dezső 2014 őszi félév (verzió 3.5)
Korszakváltás a processzorok fejlődésében Sima Dezső 2014 őszi félév (verzió 3.5)
A CPU (központi feldolgozó egység vagy processzor)
1 A számítógépek felépítése jellemzői, működése. 2 A számítógép feladata Az adatok Bevitele Tárolása Feldolgozása Kivitele (eredmény megjelenítése)
A számítógép modulokból (részegységekből) áll. Az alaplap A részek illesztését megvalósító elem:
CPU (Processzor) A CPU (Central Processing Unit – Központi Feldolgozó Egység) a számítógép azon egysége, amely értelmezi az utasításokat és vezérli.
Korszakváltás a processzorok fejlődésében
Korszakváltás a processzorok fejlődésében
Az ILP feldolgozás fejlődése
Korszakváltás a processzorok fejlődésében
Előadás másolata:

Paradigmaváltások a processzorfejlesztésben Sima Dezső augusztus 25.

Bevezetés Processzorteljesítmény (P): [utasítások/sec] P = f c * IPC *  ahol: f c :órafrekvencia IPC:óraciklusonként kibocsátott utasítások átlagos száma  :a spekulatív végrehajtás hatékonysága, azaz az eredményesen végrehajtott utasítások száma/kibocsátott utasítások száma 1.

A teljesítménynövelés lehetőségei ÓrafrekvenciaProcesszor hatékonyság 1. P = f c * IPC * 

A fejlődés áttekintése az Intel x86 processzorcsaládja esetén (1) 1. ábra: Az x86 alapú Intel processzorok fixpontos teljesítménye 1.

2. ábra: Az x86 alapú Intel processzorok órafrekvenciája 1. A fejlődés áttekintése az Intel x86 processzorcsaládja esetén (2)

3/a. ábra: Az x86 alapú processzorok közelítő hatékonysága (az 1. és a 2. ábrák közelítéseiből levezetve) 1. A fejlődés áttekintése az Intel x86 processzorcsaládja esetén (3)

A processzorhatékonyság meredeken növekvő szakasza az x86 processzorok esetén 4. ábra: Intel korai processzorainak hatékonysága 1.

A processzorhatékonyság meredeken növekvő szakasza az x86 processzorok esetén 4. ábra: Intel korai processzorainak hatékonysága 1.

A hatékonyságnövelés forrásai (x86 processzorok esetén) →szóhossz növelése 8/16  32 bit (286  386DX) →időbeli párhuzamosság bevezetése, növelése (1. és 2. generációs futószalag processzorok) (386DX, 486DX) →kibocsátási párhuzamosság bevezetése, növelése (1. és 2. generációs szuperskalárok) (Pentium) 1.

A RISC processzorok hatékonyságának intenzív növekedési szakasza 1. Hasonló jellegű az x86 processzorokéhoz (2. generációs szuperskalárokig) 3/b. ábra: Processzorok hatékonysága

ILP-szinten a hatékonyság növelési forrásainak kimerülése A 2. generációs (széles) szuperskalárokkal kezdődően általános célú alkalmazásokban a processzorok hatékonyságának extenzív növelési forrásai kimerültek 1. általános célú alkalmazásokban: 2. generációs szuperskalárok szélessége  rendelkezésre álló ILP

A processzorok hatékonyságának fejlődése (általában) 3/b. ábra: Processzorok hatékonysága 2.

A processzor hatékonyság stagnálása által kiváltott fejlődési főirányok Az órafrekvencia erőteljes növelése (~100* / 10 év) EPIC architektúra (IPC  ) 2.

Az órafrekvencia erőteljes növelése A fejlődés fő vonulata általános célú alkalmazásokban a 2. generációs szuperskalároktól kezdődően Implikációk 3. →RISC processzorok kiszorulása (MIPS R, Alpha, HP PA 8000, POWER PC) →Fejlődési korlátok megjelenése Hatékonysági korlát Disszipációs korlát Párhuzamos buszok frekvenciakorlátja

Hatékonysági korlát 4. Alapvető ok: a processzor és a memória alrendszer közötti táguló sebességolló.

Okok (1) 5. ábra: Processzor memóriák relatív késleltetési ideje 4.

Okok (2) 6. ábra: Processzor memóriák relatív átviteli rátája (D: kétcsatornás) 4.

Okok (3) 7. ábra: A processzor busz relatív sebessége 4.

Következmények (1) 8. ábra: Intel Pentium III és Pentium 4 processzorainak hatékonysága fixpontos feldolgozás esetén 4.

9. ábra: AMD Athlon, Athlon XP és Athlon 64 processzorainak hatékonysága fixpontos feldolgozás esetén 4. Következmények (2)

10. ábra: Fejlett szuperskalár processzorok hatékonysága megszabó legfontosabb tényezők 4. Következmények (3)

11. ábra: Intel és AMD processzorok hatékonyságának összehasonlítása 4. Következmények (4)

12. ábra: Intel és AMD processzorok tervezési filozófiájának összehasonlítása 4. Következmények (5)

Az órajelfrekvencia intenzív növelése helyett a processzor hatékonyság előtérbe kerülése 4. A processzorok hatékonysági korlátja

Disszipációs korlát (1) Disszipáció (D) : D=A*C*V*f c + V*I leak ahol: A:aktív kapuk részaránya C:a kapuk összesített kapacitása V:tápfeszültség f c :órafrekvencia I leak :szivárgási áram 5.

13. ábra: Intel processzorok fajlagos disszipációja 5. Disszipációs korlát (2)

14. ábra: Intel és AMD processzorok 5. Disszipációs korlát (3)

A processzor tervezésben a disszipációt csökkentő technikák előtérbe kerülése 5. Disszipációs korlát (4) Az órafrekvencia növelését hangsúlyozó fejlesztési irány háttérbe szorulása

Párhuzamos buszok frekvenciakorlátja 6.

Okok (1) 15. ábra: Párhuzamos buszok bitvezetékei közötti futási idő különbségek (skew) 6.

Okok (2) 16. ábra: A futási idő különbségek (skew) kiegyenlítése a MSI 915 G Combo alaplap processzor buszánál 6.

Következmény 17. ábra: Jelátvitel soros buszon A futási idő különbségek (skew) kiegyenlítése a MSI 915 G Combo alaplap processzor buszánál 6. Soros buszok használata

Gyors párhuzamos buszok helyett a soros buszok előtérbe kerülése (lassú buszoknál is, költségokokból) 6. Párhuzamos buszok frekvenciakorlátja

A jelentkező fejlesztési korlátok végső következményei ábra: Az órafrekvencia növelési helyzete Az órafrekvencia növekedésének lényeges lassulása

A processzor fejlesztések jelenlegi főirányai (1) 7. Általános célú alkalmazásokban az ILP szintű párhuzamosság kimerülése Az órafrekvencia növekedésének lényeges lassulása ILP  TLP Többmagos processzorok A fejlődés jelenlegi főbb korlátai:

A processzor fejlesztések jelenlegi főirányai (2) ábra: A többszálas technika fogalma ILP  TLP

A processzor fejlesztések jelenlegi főirányai (3) ábra: A többszálas technika alapvető alternatívái Simplest implementation alternatives of multithreaded processors Single core dual threaded Dual core single threaded L2/L3 Core L3/Memory SMT Proc.-core L2/L3 L3/Memory Additional complexity ~ 5%~ 50-80% Performance increase~ 0-15%~ 50-70%

A processzor fejlesztések jelenlegi főirányai (4) ábra: Fontosabb többszálas processzorok Dual core single threaded Single core dual threaded Dual core dual threaded Power4 (4/2001) 0.18  /170 mtrs. Power5 (5/2004) 0.13  /276 mtrs. Xeon MP (3/2002) 0.18  /108 mtrs. Pentium 4/HT (11/2002) 0.13  /55 mtrs. Pentium D (Smithfield) (4/2005) 0.09  /230 mtrs. P4 Prescott (2/2004) 0.09  /100 mtrs. Pentium EE 840 (4/2005) 0.09  /100 mtrs. Dual-core Opteron (2005) 0.09  /233 mtrs. Athlon 64 X2 (6/2005) 0.09  Montecito (2005) 2*Itanium 2 (Madison) 0.09  /1300 mtrs. IBM Intel AMD Intel RISC CISC VLIW

Köszönöm a figyelmet!

22. ábra: Itanium processzorok hatékonysága