A szövegbányászat üzleti alkalmazása DMS Labor konferencia, 2004. szept. 29. Miskolczy Csaba ügyvezető.

Slides:



Advertisements
Hasonló előadás
Tudásmenedzsment és a Web 2.0
Advertisements

Internetes források nem csak ZOOLÓGIA zoo/zoo03.ppt
Copyright © 2012, Oracle and/or its affiliates. All rights reserved. 1.
Tanyanyagtárházak lépjünk túl egy LMS korlátain Networkshop 2010 Debrecen, április Vágvölgyi Csaba
Technológiai fejlesztés a hatékony ellátás szolgálatában
Mobil eszközök alkalmazása vállalati környezetben
Hol szökik a hatékonyság
A jövő technológiái Kőnig Tibor főmérnök, Microsoft Magyarország blogs.msdn.com/tibork-on-ms blogs.msdn.com/tibork-on-ms.
Hatásos munkatársak – sikeres vállalat Office 2010 és a kapcsolódó lehetőségek Nagy Levente Üzletágvzető Microsoft Magyarország.
Tanszéki konzulens: Horváth Ákos Készítette: Kóródi Norbert.
Új funkciók az EBSCOhost-ban november 21. Egyetemi Könyvtár Szeged.
GOOGLE 1998 szeptember Ma: az IN-es keresés 75%-a Webes keresés Képkeresés Usenet csoportokban Könyvtárban (hierarchikus katalógus) Egyéb szolgáltatások.
Az IKT kompetenciaterület specialitásai
A CAD/CAM modellezés alapjai
Üzleti intelligencia Kecskemét 2007 ősz. BI Business Intelligence Üzleti Intelligencia Bevételnövelő és költségcsökkentő lehetőségek feltárása, döntéstámogatás.
Az informatika, mint szakma fejlődik Egyre több dologra és több helyen használjuk Nagyobbak és komplexebbek a rendszereink Rugalmasan kell reagálnunk.
Kliensoldali Programozás
Info-Periszkóp Mezőgazdasági külső információs rendszer fejlesztési tapasztalatai Pető István – Szent István Egyetem, Gödöllő Gazdasági Informatika Tanszék.
Copyright © 2005 | update software AG | update software Magyarország Kft. Radics Sándor principal IV.
Microsoft CRM online Strén András
Webes Információs Rendszerek fejlesztése
Copyright © 2012, SAS Institute Inc. All rights reserved. STATISZTIKA ÉS VIZUALIZÁCIÓ - ÚJ LEHETŐSÉGEK A STATISZTIKAI ADATOK MEGJELENÍTÉSÉRE ÉS FELTÁRÁSÁRA.
 mesterséges intelligencián alapuló szoftver rendszer  a felhasználó által szolgáltatott adatok alapján képes viszonylag bonyolult problémákat megoldani,
Szemantikus keresők.
1 Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Célkitűzés: Információk téma-specifikus, különböző típusú forrásokból (internet, intranet.
1/20 Kulturális örökség a Szemantikus Weben a Museum24 projekt Szász Barnabás Finnország, 2005.
WEB 2.0. Amiről szó lesz… Web átalakulóban, a WEB 2.0 –Újszerű weboldalak… –Első a tartalom! –A felhasználók hatalomátvétele?! –A Web mint platform –
Adatbányászat és üzleti intelligencia SPSS – MicroStrategy integráció
Körmendi György SPSS Hungary 2007 november 6. Magyar nyelvű szöveganalitika.
ICR technológia és alkalmazási területei DoqSys Business Solutions
A Microsoft Üzleti Intelligencia megoldása és platformja
Slides for Quantum Computing and Communications – An Engineering Approach Chapter 7 Searching in an Unsorted Database Sándor Imre Ferenc Balázs.
Az IKT szerepe a kompetencia alapú oktatásban. THE EDUCATION INFRASTURCTURE IN HUNGARY I. The number of personal computers and users in educational institutions.
Bevezetés a szemantikus technológiákba. Szemantikus technológiák  Rendszerelemek – jelentés – logikai formula  Elvárások – logikai formula  Az elvárások.
Ismétlés. "Man - a being in search of meaning." Plato Searching in an Unsorted Database.
Irány a felhő Előnyök, tapasztalatok Sárdy Tibor
Kiss Tibor System Administrator (MCP) ISA Server 2006.
OSINT eszközök a gyakorlatban avagy hogyan gyűjtsünk és elemezzünk nyílt adatokat személyekhez kapcsolódóan Dr. Gorza Jenő PhD nyá. ezredes, c. egyetemi.
ECM evolúció – a Leitz-iratgyűjtőtől a tanúsított iratkezelésig Ovitas Magyarország Informatikai Kft. Vitéz Miklós Budapest, november 8.
Egységes tartalomkezelés - Adatharmonizálás ECM filozófiával -
BIRDIE Business Information Reporter and Datalyser Előadó: Schneidler József.
Farkas Bálint | Technical Evangelist | Microsoft.
Internet tudományos használata Skultéti Attila 2015.
Internet tudományos használata Skultéti Attila 2015.
2007. szeptember 27. DMS Forte - Dokumentumkezelési újdonságok 1 Az ECM felszínre törése - DMS konvergencia (Enterprise Content Management, Document Management.
ECM vagy DMS terméket vegyek?
OVIDIUS Info-Service Co Ltd.
“Tudásmegosztás és szervezeti problémamegoldás a mesterséges intelligencia korában” Levente Szabados Technológiai Igazgató.
A tartalommarketing lehetőségei és korlátai a gyógyszergyártók szemével szeptember 29.
Tudásmenedzsment és a Web 2.0
OVIDIUS Info-Service Co Ltd.
Farkas Bálint | Technical Evangelist | Microsoft
OVIDIUS Info-Service Co Ltd.
OVIDIUS Info-Service Co Ltd.
dr. Geges József Ovidius Co. Ltd.
GEGES JÓZSEF Ph.D. OVIDIUS Info-Service Co Ltd.
OVIDIUS Info-Service Co Ltd.
Ovidius InfoService Co. Ltd.
Microsoft SQL licenselés a gyakorlatban
A MEDLINE JÖVŐJÉRŐL a szemantikus web tükrében
Csurgalékvíz tisztítás
Semmi szükség a biztonságra
Az internet minőségi információ halmazainak feltárásáról
A SZEMANTIKUS WEB KERESŐGÉPEI „FIND WHAT I MEAN NOT WHAT I TYPE”
dr. Geges József Ovidius Co. Ltd.
Ovidius InfoService Co. Ltd.
1 Tudásbázis követelmények a digitális korszakban Gyulay Tibor tudásmenedzsment szakértő előadása „A tacit (avagy a hallgatólagos tudás) jövője a negyedik.
Vállalatirányítási rendszerek alapjai
A világ sarkából is elérhető könyvtár, a könyvtár sarkából is elérhető világ Winkler Bea.
Előadás másolata:

A szövegbányászat üzleti alkalmazása DMS Labor konferencia, szept. 29. Miskolczy Csaba ügyvezető

T A R T A L O M 1. rész: Competitive Intelligence 2. rész: Information Retrieval 3. rész: Piaci helyzet „People have silly reasons why computers don't really think. The answer is we haven't programmed them right; they just don't have much common sense. Marvin Minsky, MIT

Szövegbányászati technológia Célja: jelentéstartalmak felismerése Attribútuma: öntanuló (lásd AI) és képes információ strukturálásra kategorizáltömörít újdonság detekció releváns keresés

Competitive Intelligence folyamata TRACKING Crawler RSS feed IR Search Engine TM – releváns keresés ADATBÁZIS Web Aggregátorok Szövegalapú adatbázis INFO STRUKT. Metaadat-kezelés Kategorizáció Ontológia Text Mining eszközök végcél: hatékony visszakeresés v. informálódás

Hatékony visszakeresés (1.) Kulcsszavas keresés TM-mel: tárgyszó-tár Dinamikusan változó Komplex lingvisztika Szinoníma Homoníma Témaosztályok Kapcsolatok Ranking és egyéb attribútumok haszon: Releváns találat Egységesülő metaadat vállalati szinten (lásd TM) Azonos jelentések párhuzamos elérése Lehetőség témaosztályok szerinti, hierarchikus keresésre Csökken a találati pontatlanság (pl. ATM)

Hatékony visszakeresés (2.) Jelentésalapú, logikai keresés TM-mel: logika (AI) tárgyszavak kapcsolatuk irányuk haszon: Jelentésalapú találat Hiányos entitás nem okoz gondot a felismerésben Lehetőség újdonság detekcióra Komplex szöveg-kivonatolás és tömörítés Tematika alapú keresés

Hatékony informálódás infotracking tárgyszó-alapú logikai / tematikai faktografikus numerikus infoanalízis riadóztatás tacit elemek feltárása predikció historikus nézet haszon: nő a feldolgozható mennyiség (pl. regionális) csökken a ráfordított idő (pl. elemzői) döntéstámogatás végcél: competitive intelligence

Nem elegendőek a legdrágább és intelligens szoftverek ezek nélkül: Metaadat-kezelés és egységes tárgyszótár fontossága (alapvető!) Kritikus a forráskezelés és forrásszelekció Céges felhasználóknál egységesített és szoftverhez igazított folyamatok (újak is) Tartalomfejlesztés és emberi / tanácsadói tudás beépítésének fontossága (lásd HR-allokáció) Célzott elemzői kérdések SUMMARY - üzleti tapasztalatok

T A R T A L O M 1. rész: Competitive Intelligence 2. rész: Information Retrieval 3. rész: Piaci helyzet „A számítógépek haszontalanok. Csak válaszolni tudnak.” Pablo Picasso

Információ visszakeresés (IR) Felhasználás: Content Man. (CMS)Docum. Man. (DMS) Intranetweb Hatékonyság elemei: relevancia sokaság szűrés újdonság érték ranking / stat

IR szoftveres technológiái TECHNOLÓGIAELŐNYHÁTRÁNY KategóriaEgyszerű navigációKeresés sok kattintással HypertextKapcsolódó témák elérése Bolyongás a tartalmak között SzótárAzonos tartalmak elérése (search eng. kell hozzá) Folyamatos content munka (bővítés) KulcsszavakEgyszerű kereshetőség Kimaradó tartalmak és számos találat SzinonímatárJelentés alapú elérésFolyamatos karbantartás Szemantikus hálóTudásintegrációKöltséges és HR erőforrás igényes

IR nemzetközi trendek Hagyományos ún. 2 dimenziós keresés: Kereső terminusok megadása Szövegalapú eredménylista (számos találattal) Találat szűrése, szelekciója (pl. Boolean query) Kapcsolódó topic-ok Magasszintű penetráció Újfajta ún. Visual searching A találatok grafikusan megjelenítve + kontextusba rendezve Relációk mentén „érzés” alapján keresni Nem elterjedt: Google, Yahoo! nem lépett Várható térhódítás: info-intenzív piacok (pl. pénzügy, gyógyszer, törvény stb.)

Visual Searching felhasználása Adatbányászati és szövegbányászati célokra Competitive Intelligence (CI) Exponenciálisan növekvő, struktúrálatlan források esetében Enterprise Solutions (pl. Inxight) Identifikál Kategorizál Kollaborációt támogat Példák: MatchPoint Search (TripleHop Inc.)

VS példa: TripleHop MatchPoint Search (TripleHop Inc.): Context Sensitive Search CNN, USA Today, Novartis, Cap Gemini Ernst & Young Group

VS példa: Inxight – 1. rész SmartDiscovery 4 search system részei: Entity extraction - automatikusan felismer a szövegben 25- féle entitást: Address City Company Country Currency Date Day Financial Index Holiday Internet Address Month Measure Noun Group Organization Percent Person Position Given Name Family Name Suffix Phone Number Place Regions Political Geographic Types Product Social Security Number State Time Time Period Vehicle Make Model Color VIN License Plate Year

VS példa: Inxight – 2. rész SmartDiscovery 4 search system részei: Entity extraction - metaadatok Fact extraction – releváns események, akciók és kapcsolatok (BI) Taxonomy management and categorization („browser- based taxonomy editor provides an intuitive interface for creating and managing taxonomies and determining how they should be applied to different data sets.”) Search and Summarization (with linguistic process):

Visual Searching kihívásai VS ott igazán hatékony ahol......sokféle dokumentumtárban kell keresni, és ezek eltérő platformúak.... sokféle formában kell dolgozni, például: intranet, DMS, servers... ahol szükség van clustering-re: summary, title, kivonat Nagyvállalati alkalmazások

T A R T A L O M 1. rész: Competitive Intelligence 2. rész: Information Retrieval 3. rész: Piaci helyzet „Akármit akar mondani az ember, mindíg csak egy szó van a kifejezésére.” Mauppassant

Szoftveres benchmarking TECHNOLÓGIAERŐSSÉGCÉG Text Mining (TM) Kategorizáció, többnyelvűség AUTONOMY TM AI, Taxonómia alapú kategorizáció, tömörítés Megaputer TM és CI Kategorizáció és vizuális megjelenítés Clearforest CI Dobozos (off-the-shelf) termékek, hasonló egykori push-technológiához Copernic, Serence (klipfolio) Fee-based service Hírszolgáltatások Factiva, NewsGator, InternetSecurities Knowledge Management Strukturált információbázis Empolis (SigmaLink)

IR piaci verseny (1.) MICROSOFT: MSN beerősített a kereső fronton Beépítette a keresést az op-rendszer szintjén is Szövetség nagy adatbázisszolgáltatókkal USD 70 mrd cash-állomány Eddig nyert: op-rendszer, webbrowser (Netscape), RealPlayer ellen Win Media Playerrel Eddig vesztett: Xbox, mobil op-rendszer, tablet PC Google: Gmail új szolgáltatás (ápr, MSN Hotmail és Yahoo! ellen, 1 GB tárhely) Yahoo! idén felbontotta a szerz-t vele USD 455 m cash Bevonandó USD 2,7 mrd-nyi részvény Kapitalizáció mrd?

IR piaci verseny (2.) Yahoo Overture technológiája (MSN-nek is átadja) Máj.: 6 Mb-ról 100 MB-ra tárhely Szövetség nagy riválissal Lycossal (EU: chat és üzenetküldés megosztása)

„Ignorance is the greatest threat to modern business. The risk of not knowing is immense.” Gartner, Inc