Paradigmaváltások a processzorfejlesztésben Sima Dezső augusztus 25.
A processzorok hatékonyságának fejlődése (általában) 3/b. ábra: Processzorok hatékonysága 2.
A processzorhatékonyság meredeken növekvő szakasza az x86 processzorok esetén 4. ábra: Intel korai processzorainak hatékonysága 1.
A hatékonyságnövelés forrásai (x86 processzorok esetén) →szóhossz növelése 8/16 32 bit (286 386DX) →időbeli párhuzamosság bevezetése, növelése (1. és 2. generációs futószalag processzorok) (386DX, 486DX) →kibocsátási párhuzamosság bevezetése, növelése (1. és 2. generációs szuperskalárok) (Pentium) 1.
ILP-szinten a hatékonyság növelési forrásainak kimerülése A 2. generációs (széles) szuperskalárokkal kezdődően általános célú alkalmazásokban a processzorok hatékonyságának extenzív növelési forrásai kimerültek 1. általános célú alkalmazásokban: 2. generációs szuperskalárok szélessége rendelkezésre álló ILP
A processzor hatékonyság stagnálása által kiváltott fejlődési főirányok Az órafrekvencia erőteljes növelése (~100* / 10 év) EPIC architektúra (IPC ) 2.
Az órafrekvencia erőteljes növelése A fejlődés fő vonulata általános célú alkalmazásokban a 2. generációs szuperskalároktól kezdődően Implikációk 3. →RISC processzorok kiszorulása (MIPS R, Alpha, HP PA 8000, POWER PC) →Fejlődési korlátok megjelenése Hatékonysági korlát Disszipációs korlát Párhuzamos buszok frekvenciakorlátja
Hatékonysági korlát 4. Alapvető ok: a processzor és a memória alrendszer közötti táguló sebességolló.
Okok (1) 5. ábra: Processzor memóriák relatív késleltetési ideje 4.
Okok (2) 6. ábra: Processzor memóriák relatív átviteli rátája (D: kétcsatornás) 4.
Okok (3) 7. ábra: A processzor busz relatív sebessége 4.
Következmények (1) 8. ábra: Intel Pentium III és Pentium 4 processzorainak hatékonysága fixpontos feldolgozás esetén 4.
9. ábra: AMD Athlon, Athlon XP és Athlon 64 processzorainak hatékonysága fixpontos feldolgozás esetén 4. Következmények (2)
10. ábra: Fejlett szuperskalár processzorok hatékonysága megszabó legfontosabb tényezők 4. Következmények (3)
11. ábra: Intel és AMD processzorok hatékonyságának összehasonlítása 4. Következmények (4)
12. ábra: Intel és AMD processzorok tervezési filozófiájának összehasonlítása 4. Következmények (5)
Disszipációs korlát (1) Disszipáció (D) : D=A*C*V*f c + V*I leak ahol: A:aktív kapuk részaránya C:a kapuk összesített kapacitása V:tápfeszültség f c :órafrekvencia I leak :szivárgási áram 5.
13. ábra: Intel processzorok fajlagos disszipációja 5. Disszipációs korlát (2)
14. ábra: Intel és AMD processzorok 5. Disszipációs korlát (3)
Intel P4 processzorcsaládja (Netburst architektúra) – 14 –
A processzor tervezésben a disszipációt csökkentő technikák előtérbe kerülése 5. Disszipációs korlát (4) Az órafrekvencia növelését hangsúlyozó fejlesztési irány háttérbe szorulása
Párhuzamos buszok frekvenciakorlátja 6.
Okok (1) 15. ábra: Párhuzamos buszok bitvezetékei közötti futási idő különbségek (skew) 6.
Okok (2) 16. ábra: A futási idő különbségek (skew) kiegyenlítése a MSI 915 G Combo alaplap processzor buszánál 6.
Következmény 17. ábra: Jelátvitel soros buszon A futási idő különbségek (skew) kiegyenlítése a MSI 915 G Combo alaplap processzor buszánál 6. Soros buszok használata
Gyors párhuzamos buszok helyett a soros buszok előtérbe kerülése (lassú buszoknál is, költségokokból) 6. Párhuzamos buszok frekvenciakorlátja
A jelentkező fejlesztési korlátok végső következményei ábra: Az órafrekvencia növelési helyzete Az órafrekvencia növekedésének lényeges lassulása