Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Gépi intelligencia, gépi tanulás Varga Dániel 2007. november 29.

Hasonló előadás


Az előadások a következő témára: "Gépi intelligencia, gépi tanulás Varga Dániel 2007. november 29."— Előadás másolata:

1 Gépi intelligencia, gépi tanulás Varga Dániel november 29.

2 Kis AI-történelem a játékok tükrében '49 az első Neumann-architektúrájú számítógépek. '51 Első sakkprogram papíron (Alan Turing) '58 Első sakkprogram. '59 Dámaprogram, amely a legjobb játékosokat is rendszeresen legyőzi. '81 Sakkprogramok elérik a hivatalos mesterszintet. '97 Deep Blue megveri a sakkvilágbajnokot rendes mérkőzésen. '03...De még ma is gyakran döntetlen az eredmény világbajnokokkal. '07 A legjobb gó-program nagyjából egy átlagos japán iskolás szintjén van.

3 Exponenciális robbanás Ha minden állásban két szóba jöhető lépést nézünk meg, akkor a hat lépésre előre gondolkozáshoz 2^12=4096 állást kell értékelnünk. Nem sok. Ha tizet, akkor 10^12=1,000,000,000,000 állást. Sok.

4 Exponenciális robbanás II. Az emberi intelligencia gépi utánzásán dolgozva általában beleütközünk az exponenciális robbanás problémájába. Az emberi agy miért van előnyben? Egyrészt, mert nagyon sok alkatrészből áll, amik párhuzamosan működnek. De főleg, mert az agy olyan, evolúcióval vagy tanulással finomra hangolt heurisztikákat alkalmaz, amelyek lehetővé teszik, hogy a nagyszámú lehetőség közül csak a legígéretesebbeket vizsgálja meg.

5 Látás Tracking: egy mozgó tárgy követése mozgóképen képkockáról képkockára: az utóbbi években kezdenek jobb eredményeket elérni. Arcfelismerés: rossz (Soha egyetlen bűnözőt sem fogtak a repülőtereken felszerelt rendszerek.) Karakterfelismerés –nyomtatott szöveg: jó –rendszámtábla (=tracking+nyomtatott szövegfelismerés): elfogadható –írott szöveg: gyenge –Itt említem meg: CAPTCHA.

6 Itt is segít, ha mi alkalmazkodunk: a vonalkód 30 éve megbízható módszer, és a hagyományos PDA-k is egy egyszerűsített betűkészletet alkalmaznak, ami külön a számítógép kedvére lett kialakítva.

7 Nyelv Szószintű elemzők, helyesírásellenőrzők (Office: Helyes-e, OpenOffice: hunspell) –Többértelműség: termet, béget, államban, mellé, árnyék (3), rádiósláger Mondatszintű elemzés: nagyon nehéz. Exponenciális robbanáshoz vezető többértelműségek, amelyek csak mélyebb megértés útján feloldhatóak.

8 Példa egy fordítóprogramtól North Korea triggered global alarm on Tuesday by saying it will conduct a nuclear test, a key step in the manufacture of atomic bombs that it views as a deterrent against any U.S. attack. But the North also said it was committed to nuclear disarmament, suggesting a willingness to negotiate. Észak-Korea kedden globális riasztót indított el azáltal, hogy azt mondta, hogy ez vezetni fog egy kísérleti atomrobbantást, egy fő lépés olyan atombombáknak a gyártásában, amiket ez elrettentésként megnéz bármilyen amerikai támadás ellen. De a North szintén azt mondta, hogy azt nukleáris fegyverzetcsökkentésbe követték el miközben azt javasolta egy szolgálatkészségnek, hogy tárgyaljon. (Helyesen: tárgyalásra való hajlandóságot sugallva, de formailag ez is helyes.)

9 Beszédszintézis Már használható. Különválasztható a hangszín és a hangsúlyozás kérdésére. A hangszínt kis csalással oldjuk meg: ellopjuk egy ember hangszínét. A jelenlegi világszínvonal: A hibátlan hangsúlyhoz a tartalom megértése kellene.

10

11 Beszédfelismerés Korlátozott szókincsre jól kezelhető, szabad szókincsre nagyon nehéz. (Megint az exponenciális robbanás.) –Ha lenne jó szövegértésünk, az csökkentené a szóba jöhető lehetőségek számát. Sokkal könnyebb a beszélőfüggő változat, amikor csak egyetlen konkrét ember hangját kell felismerni.

12 Jó, de végül is hogyan csinálják ezeket?

13 Kemény AI A mesterséges intelligencia hőskorában nagy reményeket fűztek a logikai következtetéseken alapuló rendszerekhez olyan feladatok megoldásában, mint a szövegértés vagy az orvosi döntéstámogatás. Prolog, Cyc. apja(F,C) :- férfi(F), szülője(F,C). Az emberi agyműködés nagyon kis szelete a logikai érvelésen alapuló. Csak néhány százezer éve létezik, miközben például a tárgyak vizuális követésének képességét évszázmilliók óta csiszolja az evolúció.

14 Puha AI A következtetés helyett a mintaillesztésre koncentrál. Igen-nem válaszok helyett bizonyossági szinteket ad. Tulajdonképpen „a statisztika felturbózott változata”.

15 Példa: spam-szűrő építése Van sok levelem, és tudom róluk, hogy melyik spam és melyik valódi levél. Jön egy új levél, és el kellene dönteni, hogy spam-e. Ez egy felügyelt tanítási, azon belül is felügyelt címkézési feladat. A feladatot megoldó tanulóprogram szabályszerűségeket keres a már megcímkézett adatok között, és aztán ezek alapján megpróbálja megcímkézni az új adatokat.

16 További felügyelt címkézési feladatok Betűfelismerés –kép → az ábécé egy betűje Szófaji egyértelműsítés –egy szó és szövegkörnyezete ("A nyúl viszi a") → szófaj (főnév) Hangulatfelismerés –egy arcot ábrázoló kép → ingerült/rémült/boldog/stb. A tanulóprogramok jó hatásfokához sok tanítóadat szükséges. Óriási iparág a tanító-adathalmazok manuális építése.

17 Jegykivonás A matematikai módszerek számoszlopokat szeretnek címkézni. Csináljuk a levélből számoszlopot mondjuk úgy, hogy megszámoljuk, hogy melyik szó hányszor szerepel benne. Természetesen sokkal kifinomultabb módszerek is vannak számoszlop- csinálásra, például arcfelismerésnél az EigenFace. (http://cognitrn.psych.indiana.edu/nsfgrant/FaceMachine/faceMachine.html)http://cognitrn.psych.indiana.edu/nsfgrant/FaceMachine/faceMachine.html

18 Modellépítés Pontszámokat szeretnénk adni a levelekben gyakran előforduló egyes szóalakoknak úgy, hogy a levél szavait eszerint pontozva, és a pontszámokat összeadva nagy összpontszámúak legyenek a spamek, és kis összpontszámúak a nem-spamek. Egy ügyes matematikai eljárással úgy választjuk meg a szavak pontszámait, hogy tanítóhalmazunkban igaz legyen a feltétel. Ez a pontozás a tanítóhalmaz alapján épített modell. Példa: Állítólag(-10) hatalmas(+20) mennyiségű(+1) nyugtató(+100) hatása(+10) alatt(-5) állt.(-5) = 111 pont. Reménykedünk, hogy a feltétel „éles helyzetben” is igaz lesz. Ezt úgy mondjuk, hogy a modell általánosít a tanítóadatokról a valós adatokra. Példánkban nagy pontszámot ad a nyugtató szónak, mert „észreveszi”, hogy spam-ekben szokott szerepelni.

19 Autonóm robotok (Hol tartanak?) Futnak Autót vezetnek Fociznak Összerakják alkatrészekből a saját hasonmásukat. (Majdnem.) (Egyiket sem túl meggyőzően.)

20

21

22

23

24 Robotszék

25 Rajzás Herbert Simon: Egy élőlény viselkedése nagyon összetettnek tűnhet, de ennek az összetettségnek egy jelentős része abból származik, hogy a környezet, amivel interakcióban van, maga összetett. Építsünk sok egyszerű lényt, amik együtt komplex működésre képesek, mint egy hangyaboly. Nanorobotok, szürke ragacs. Genetikus algoritmusok: Mesterséges evolúció. Ha tanulóadatainkhoz modellt akarunk építeni, akkor építsünk sokat, és aztán ivarosan szaporítsuk őket, és pusztuljon, amelyik rosszul jósolja az adatokat.

26 Hogyan írnánk olyan programot, ami ismeretlen magyar keresztnevekről megállapítja, hogy férfi- vagy női nevek? Az egyik lehetőség. hogy nézegetünk egy listát nevekről, szabályszerűségeket keresünk benne, és ezeket egyenként beleírogatjuk a programba. Például valószínűleg elég hamar rájönnénk arra a szabályszerűségre, hogy ha a név a-ra vagy ke-re végződik, akkor jó eséllyel női, ha ld-re, akkor férfi (Bertold, Arnold, Tibold, Oszvald stb.). Persze lennének kivételek: Géza, Miksa, Aba, Cseke, Benke férfinevek, Matild és Klotild női nevek. A kivételeken vagy hibázna a program, vagy újabb szabályokat kellene keresnünk hozzájuk.

27 Automatikus szabálykeresés A szabályszerűségek egyenkénti megtalálásánál hatékonyabb lehet, ha a gépre bízzuk, hogy általunk összeállított szabályszerűségek sokaságából kiválassza a fontosakat, és súlyozza őket jelentőségük szerint. a-ra végződik: plusz 3.24 pont ke-re végződik: plusz 2.23 pont d-re végződik: mínusz 2.15 pont r-re végződik: mínusz 2.09 pont s-re végződik: mínusz 1.86 pont at-tal kezdődik: mínusz 1.41 pont ó-ra végződik: mínusz 1.39 pont i-re végződik: plusz 1.31 pont arn-ot tartalmaz: mínusz 1.21 pont...

28 Kollaboratív ajánlás Tegyük fel, hogy egy weboldalon sok ember megadja, hogy mik a kedvenc filmjei. Ez alapján egy számítógép ajánlásokat tud adni a felhasználóknak. Egy módszer: Megnézi, hogy a többi felhasználó közül kikhez hasonlít a legjobban az ízlésünk, és olyan filmet ajánl, ami ezeknek tetszett, de mi még nem láttuk.

29 PageRank Egy másik példa arra, amikor az ember végzi el a munka nehezebbik részét, és a gép learatja a babérokat. A teljes web linkhálózata alapján számolják. Ha az oldalamról linket rakok egy másikra, az szavazatnak számít mellette. Minél több szavazatot kaptam, annál többet ér a szavazatom másokra. Nem azonos a hivatkozások számával!

30

31 Lehetséges-e gondolkodó és öntudattal bíró gépeket építeni? Egyesek szerint nyilván igen. Mások szerint nyilván nem. A biológia mai állása szerint az ember is egy nagyon bonyolult gépezet. Az emberről biztosan tudjuk, hogy gondolkodik, és van öntudata. Tehát aki szerint nyilvánvalóan nem a válasz (, és hisz a biológia mai állásának), annak meg kellene tudni mondania, hogy az általunk megépíthető gépek milyen alapvető tulajdonságban különböznek az ember-géptől.

32 Szerintem Szerintem nagyon nehéz lesz ilyen gépet építeni, de nincsen elvi akadálya. Intelligencia, öntudat, szándékok, érzelmek: Az állatvilág példája azt hiszem azt mutatja, hogy egyik sem vagy-van-vagy-nincs, hanem mindegyik fokozatok és változatok kérdése. Ezeket a nézeteket angolul tudóknak részletesebben fejti ki például: –http://www.scottaaronson.com/democritus/lec4.htmlhttp://www.scottaaronson.com/democritus/lec4.html

33 "The question of whether a computer can think is no more interesting than the question of whether a submarine can swim." (Edsger Dijkstra)


Letölteni ppt "Gépi intelligencia, gépi tanulás Varga Dániel 2007. november 29."

Hasonló előadás


Google Hirdetések