Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Paradigmaváltások a processzorfejlesztésben Sima Dezső 2005. augusztus 25.

Hasonló előadás


Az előadások a következő témára: "Paradigmaváltások a processzorfejlesztésben Sima Dezső 2005. augusztus 25."— Előadás másolata:

1 Paradigmaváltások a processzorfejlesztésben Sima Dezső 2005. augusztus 25.

2 Bevezetés Processzorteljesítmény (P): [utasítások/sec] P = f c * IPC *  ahol: f c :órafrekvencia IPC:óraciklusonként kibocsátott utasítások átlagos száma  :a spekulatív végrehajtás hatékonysága, azaz az eredményesen végrehajtott utasítások száma/kibocsátott utasítások száma 1.

3 A teljesítménynövelés lehetőségei ÓrafrekvenciaProcesszor hatékonyság 1. P = f c * IPC * 

4 A fejlődés áttekintése az Intel x86 processzorcsaládja esetén (1) 1. ábra: Az x86 alapú Intel processzorok fixpontos teljesítménye 1.

5 2. ábra: Az x86 alapú Intel processzorok órafrekvenciája 1. A fejlődés áttekintése az Intel x86 processzorcsaládja esetén (2)

6 3/a. ábra: Az x86 alapú processzorok közelítő hatékonysága (az 1. és a 2. ábrák közelítéseiből levezetve) 1. A fejlődés áttekintése az Intel x86 processzorcsaládja esetén (3)

7 A processzorhatékonyság meredeken növekvő szakasza az x86 processzorok esetén 4. ábra: Intel korai processzorainak hatékonysága 1.

8 A processzorhatékonyság meredeken növekvő szakasza az x86 processzorok esetén 4. ábra: Intel korai processzorainak hatékonysága 1.

9 A hatékonyságnövelés forrásai (x86 processzorok esetén) →szóhossz növelése 8/16  32 bit (286  386DX) →időbeli párhuzamosság bevezetése, növelése (1. és 2. generációs futószalag processzorok) (386DX, 486DX) →kibocsátási párhuzamosság bevezetése, növelése (1. és 2. generációs szuperskalárok) (Pentium) 1.

10 A RISC processzorok hatékonyságának intenzív növekedési szakasza 1. Hasonló jellegű az x86 processzorokéhoz (2. generációs szuperskalárokig) 3/b. ábra: Processzorok hatékonysága

11 ILP-szinten a hatékonyság növelési forrásainak kimerülése A 2. generációs (széles) szuperskalárokkal kezdődően általános célú alkalmazásokban a processzorok hatékonyságának extenzív növelési forrásai kimerültek 1. általános célú alkalmazásokban: 2. generációs szuperskalárok szélessége  rendelkezésre álló ILP

12 A processzorok hatékonyságának fejlődése (általában) 3/b. ábra: Processzorok hatékonysága 2.

13 A processzor hatékonyság stagnálása által kiváltott fejlődési főirányok Az órafrekvencia erőteljes növelése (~100* / 10 év) EPIC architektúra (IPC  ) 2.

14 Az órafrekvencia erőteljes növelése A fejlődés fő vonulata általános célú alkalmazásokban a 2. generációs szuperskalároktól kezdődően Implikációk 3. →RISC processzorok kiszorulása (MIPS R, Alpha, HP PA 8000, POWER PC) →Fejlődési korlátok megjelenése Hatékonysági korlát Disszipációs korlát Párhuzamos buszok frekvenciakorlátja

15 Hatékonysági korlát 4. Alapvető ok: a processzor és a memória alrendszer közötti táguló sebességolló.

16 Okok (1) 5. ábra: Processzor memóriák relatív késleltetési ideje 4.

17 Okok (2) 6. ábra: Processzor memóriák relatív átviteli rátája (D: kétcsatornás) 4.

18 Okok (3) 7. ábra: A processzor busz relatív sebessége 4.

19 Következmények (1) 8. ábra: Intel Pentium III és Pentium 4 processzorainak hatékonysága fixpontos feldolgozás esetén 4.

20 9. ábra: AMD Athlon, Athlon XP és Athlon 64 processzorainak hatékonysága fixpontos feldolgozás esetén 4. Következmények (2)

21 10. ábra: Fejlett szuperskalár processzorok hatékonysága megszabó legfontosabb tényezők 4. Következmények (3)

22 11. ábra: Intel és AMD processzorok hatékonyságának összehasonlítása 4. Következmények (4)

23 12. ábra: Intel és AMD processzorok tervezési filozófiájának összehasonlítása 4. Következmények (5)

24 Az órajelfrekvencia intenzív növelése helyett a processzor hatékonyság előtérbe kerülése 4. A processzorok hatékonysági korlátja

25 Disszipációs korlát (1) Disszipáció (D) : D=A*C*V*f c + V*I leak ahol: A:aktív kapuk részaránya C:a kapuk összesített kapacitása V:tápfeszültség f c :órafrekvencia I leak :szivárgási áram 5.

26 13. ábra: Intel processzorok fajlagos disszipációja 5. Disszipációs korlát (2)

27 14. ábra: Intel és AMD processzorok 5. Disszipációs korlát (3)

28 A processzor tervezésben a disszipációt csökkentő technikák előtérbe kerülése 5. Disszipációs korlát (4) Az órafrekvencia növelését hangsúlyozó fejlesztési irány háttérbe szorulása

29 Párhuzamos buszok frekvenciakorlátja 6.

30 Okok (1) 15. ábra: Párhuzamos buszok bitvezetékei közötti futási idő különbségek (skew) 6.

31 Okok (2) 16. ábra: A futási idő különbségek (skew) kiegyenlítése a MSI 915 G Combo alaplap processzor buszánál 6.

32 Következmény 17. ábra: Jelátvitel soros buszon A futási idő különbségek (skew) kiegyenlítése a MSI 915 G Combo alaplap processzor buszánál 6. Soros buszok használata

33 Gyors párhuzamos buszok helyett a soros buszok előtérbe kerülése (lassú buszoknál is, költségokokból) 6. Párhuzamos buszok frekvenciakorlátja

34 A jelentkező fejlesztési korlátok végső következményei 7. 18. ábra: Az órafrekvencia növelési helyzete Az órafrekvencia növekedésének lényeges lassulása

35 A processzor fejlesztések jelenlegi főirányai (1) 7. Általános célú alkalmazásokban az ILP szintű párhuzamosság kimerülése Az órafrekvencia növekedésének lényeges lassulása ILP  TLP Többmagos processzorok A fejlődés jelenlegi főbb korlátai:

36 A processzor fejlesztések jelenlegi főirányai (2) 7. 19. ábra: A többszálas technika fogalma ILP  TLP

37 A processzor fejlesztések jelenlegi főirányai (3) 7. 20. ábra: A többszálas technika alapvető alternatívái Simplest implementation alternatives of multithreaded processors Single core dual threaded Dual core single threaded L2/L3 Core L3/Memory SMT Proc.-core L2/L3 L3/Memory Additional complexity ~ 5%~ 50-80% Performance increase~ 0-15%~ 50-70%

38 A processzor fejlesztések jelenlegi főirányai (4) 7. 21. ábra: Fontosabb többszálas processzorok Dual core single threaded Single core dual threaded Dual core dual threaded Power4 (4/2001) 0.18  /170 mtrs. Power5 (5/2004) 0.13  /276 mtrs. Xeon MP (3/2002) 0.18  /108 mtrs. Pentium 4/HT (11/2002) 0.13  /55 mtrs. Pentium D (Smithfield) (4/2005) 0.09  /230 mtrs. P4 Prescott (2/2004) 0.09  /100 mtrs. Pentium EE 840 (4/2005) 0.09  /100 mtrs. Dual-core Opteron (2005) 0.09  /233 mtrs. Athlon 64 X2 (6/2005) 0.09  Montecito (2005) 2*Itanium 2 (Madison) 0.09  /1300 mtrs. IBM Intel AMD Intel RISC CISC VLIW

39 Köszönöm a figyelmet!

40 22. ábra: Itanium processzorok hatékonysága


Letölteni ppt "Paradigmaváltások a processzorfejlesztésben Sima Dezső 2005. augusztus 25."

Hasonló előadás


Google Hirdetések