Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
KiadtaDénes Lukács Megváltozta több, mint 10 éve
1
Webes felületű orvosi kódolástámogató rendszer BSc önálló laboratórium Sárándi István Konzulens: Héja Gergely 2011 tavasz
2
A problémáról
3
Célkitűzés Orvosok segítése diagnózisok kódolásában webes felületen manuálisan sok időt igényel BNO = Betegségek Nemzetközi Osztályozása Célja statisztika finanszírozás Hierarchikus kódrendszer 21 főcsoport (pl. daganatok) Kb. 10 ezer kód (pl. C3840)
4
Felhasználási séma Kódoló rendszer fibrillatio auricula paroxysmalis 1.a felhasználó (pl. orvos) begépeli a diagnózist 2.a rendszer visszaad egy tipplistát 3.a felhasználó megnézi a talált kódok leírását és dönt 4.(a felhasználó visszajelzést küld a rendszernek, hogy végül mit választott)
5
Minták Rendelkezésre állnak szakértők által kódolt, tisztított minták (diagnózis–kód párok) ~3000 darabos magyar (BNO-10) ez alapján működne a szolgáltatás ~95.000 darabos német (BNO-9) a módszerek jobb kiértékelésére
6
Módszerek
7
Lehetséges megközelítések Pl.: Strictura ureteris hydronephrosis nélkül Szintaktikai természetesnyelv-feldolgozás nincs sok elemeznivaló Szemantikus kifejezések jelentései közötti kapcsolatok leírása tárgyterületi ontológiák szükségesek Tárgyfüggetlen osztályozó módszerek
8
Osztályozás Módszerek Vektortér Bayes-modell Neurális háló (Szupportvektor-gép) Keverékek Az osztályok a BNO-kódoknak felelnek meg több ezer osztály! Mind vektorokat igényelnek bementként, de nekünk sztringjeink vannak!
9
Vektorosítás Szóhalmaz-modell (bag-of-words) dokumentumosztályozásban népszerű pl. spam szűrés erős absztrakció sorrend szóhasonlóságok (pl. morfológia, szinonimák)
10
Vektorosítás fibrillatio aricula paroxysmalis implementációs megjegyzés tároljuk csak az előforduló szavak indexét! 000…010…010…010…000 fibrillatio auricula paroxysmalis urosepsis sok ezer dimenzió!
11
Vektortér
12
Előnyei nagyon egyszerű implementáció Hátrányai lassú nem veszi figyelembe a szavak fontosságát ~43% előfeldolgozás IDF súlyozás ~52%
13
Vektortér IDF súlyozással
14
Bayes-modell
15
Naiv Bayes-osztályozó
16
Előnyei: egyszerű implementáció szilárd elméleti háttér Hátránya: naiv feltételezés gyenge eredmény (~50%)
17
Neurális modell Elemi perceptron (neuron) súlyozott összeg +eltolás nemlinearitás a súlyok tanítása MLP: multi-layer perceptron rétegesen + ×w 1 ×w 2 ×w 3 b
18
Neurális modell Tanítása ciklusokban Súlymódosítás: „legmeredekebb lejtő” Tesztelés ha a hibamérték „növekedésnek indul”, leállás fordulópont detektálása hiba-visszaterjesztés (backpropagation)
19
Neurális modell Osztályozás: kimenet = osztály relevanciója logisztikus függvény 0..1 a kimeneten több ezer kimenet!
20
Neurális modell Előnyei: futáskor gyors csak a nem zérus bemenetek esetén történik szorzás rejtett réteg növeli a számítási komplexitást, de nem javít sokat a megoldás minőségén jó eredmények (~52%) Hátrányai tanítása lassú bonyolultabb implementáció
21
Kevert modellek Különböző osztályozók eredménylistáit súlyozva egyesítjük Elgondolás: a hibásak eltérnek súlyozott összegzéssel feljöhet a helyes
22
Eredménykeverés KódBizonyosság B0,27 C0,26 A0,25 D0,11 E KódBizonyosság D0,28 A0,25 B0,17 E0,16 C0,14 KódBizonyosság A0,25 B0,22 C0,20 D0,195 E0,135 0,5
23
Kevert modellek súlyozás konstans kapuzó rendszer határozza meg bemenetfüggő klaszterezés tippelt szakértelem tippelt osztálycsoport struktúra kell használjuk ki a BNO kódhierarchiát! 21 szakértő osztályozó a főcsoportokhoz
24
Konstans súlyú keverés optimális súlyozást keresünk (w, 1-w) brute-force lépegessünk kis lépésekben w=0..1 a tesztmintán mérjük a jóságát definiálni kell valamilyen mértéket végül a két osztályozót az egész tanítómintával megtanítjuk
25
Konstans súlyú keverés Előnyei: egyszerű legjobb eredmények Hátrányai: több osztályozó esetén a brute-force módszer nem megfelelő súlyoptimalizáló rendszer kell
26
MOE tanítása Kapuzó osztályozó Címkéző kód főcs. diagnózis szűrés szakértő
27
MOE használata Kapuzó osztályozó listák összevonása szakértő szakértők becsléseinek súlyozása az adott főcsoport becsült relevanciájával × × × × diagnózis kódlisták relevanciával max v sum
28
MOE Előnyei: neurális szakértők esetén gyorsabb és jobb eredmények, mint a lapos neurális modell esetén! (~55%) egyszerű implementáció Hátrányai: ?
29
Szakértelembecslés tanítás tanítóhalmazzal tanítjuk a szakértőket (még nem tudjuk, hogy minek a szakértői lesznek) kapuzó hálót tanítunk az egyes szakértők mennyire ügyesek az adott tesztbemenetnél használata MOE-hoz hasonlóan
30
Szakértelembecslés Előnyei: jobb eredmény, mint külön-külön sok szakértővel is hatékony Hátrányai: nem valószínű szignifikáns összefüggés a kapuzó ilyen esetben két dolgot tanul: általánosan mennyire nehéz a bemenet (felesleges) általánosan mennyire jók az osztályozók (egyszerűbben is kiszámolható)
31
Implementáció
32
Alapvető felépítés Osztályozó szerver WebszerverBöngésző Egyéb kliens- program TCP, XML HTTP, XHTML
33
Osztályozó szerver Különböző parancssori paraméterezések train config.xml trainingdata.rep classif.dat osztályozó felépítésének (típus, részei, paraméterek) beolvasása XML fájlból tanítás kapott tanított osztályozó szerializálása fájlba serve classif.dat 5555 a megadott porton TCP sockettel figyel a beérkező diagnózisokat a megadott fájlból betöltött osztályozóval kódolja
34
Konfiguráció MLP 0.8 1000 bagofwords counter
35
Konfiguráció MLP 0.3 1000 bagofwords counter
36
Konfiguráció Hierarchic
37
Konfiguráció Interval ICD10.def
38
Csomagok
39
Framework
40
Classifier
41
Classifier Adapter
42
Validation
43
Neuralnetwork
44
Vector
45
Parallel többmagos gépen sok minden gyorsítható tesztelés neurális háló vektortér
46
Köszönöm a figyelmet!
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.