Webbányászat Pythonban

Slides:



Advertisements
Hasonló előadás
Programozás III STRING-XML.
Advertisements

Flex: csak rugalmasan! Kiss-Tóth Marcell Magyarországi Web Konferencia március 18.
Új online technológiák: lehetőségek és kihívások Kerese István Fejlesztési platform üzletág igazgató Microsoft Magyarország
DFAN-INF-524 és DFAL-INF-524 kurzus hallgatói számára
Kabai József AZ SQL-LEDGER SZABAD ÜGYVITELI RENDSZER
2 Forrás: The Standish Group International, Extreme Chaos, The Standish Group International, Inc., 2000.
Microsoft fejlesztőeszközök a szakképzésben Farkas Bálint Visual Studio 2008.
Adatbányászati technikák (VISZM185)
Informatika matematika speciális tagozat - tematika évfolyam -
Python script/ GUI (töltőre navigálás) Kinect/ROS/ Linux Interface ROS Linux – Apache web statisztikák Lehetséges feladatok.
Statikus vs. dinamikus weblapok
WEB Technológiák Dr. Pance Miklós – Kolcza Gábor Miskolci Egyetem.
Célkeresztben az érettségi! A legjobb és leghatékonyabb eszközt akarjuk Kevesebb hibalehetőség, barátságos hibaüzenetek Kiváló fejlesztőeszköz Gyorsan.
Programozási technológia 1
Szombathely Dinamikus WEB programozás: PHP és JSP.
Google earth és a térinformatika kapcsolata
Operációs rendszerek gyakorlat 8. Gyakorlat Vakulya Gergely.
PHP I. Alapok. Mi a PHP? PHP Hypertext Preprocessor Szkriptnyelv –Egyszerű, gyors fejlesztés –Nincs fordítás (csak értelmező) Alkalmazási lehetőségek:
A digitális dokumentumok hosszútávú megőrzésének problémái Moldován István OSZK MEK Osztály „Networkshop” Szeged, március 30.
Web Application for Resource Planning
Új programozási paradigmák a láthatáron (aspektus-orientált és intencionális programozás) Csontos Péter AITIA Informatikai Rt. 2002/10/17.
Gimp v2.2 Csanádi Norbert The Gimp.
ARCHITECTArchitect AcademyFoundationsInsidersMCPtréningekvizsgákgyakorlatprojektek Novák István eEvangelist – „Dive deeper” Grepton Zrt. Technológiai vezető.
Bátyai Krisztián NetAcademia Oktatóközpont oktató, fejlesztő MCT, MCPD
Szoftvertechnológia alapjai Java előadások Förhécz András, doktorandusz tárgy honlap:
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék R „Big Data” elemzési módszerek Kocsis Imre
1 Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Célkitűzés: Információk téma-specifikus, különböző típusú forrásokból (internet, intranet.
Flash és PHP? De még mennyire! Kiss-Tóth Marcell
Bevezetés a PRADO keretrendszerbe Kardos Gergely.
Gábor Dénes Főiskola Rendszertechnikai Intézet
1 Hernyák Zoltán Programozási Nyelvek II. Eszterházy Károly Főiskola Számítástudományi tsz.
1 Hernyák Zoltán Web: Magasszintű Programozási Nyelvek I. Eszterházy.
A D programozási nyelv Angeli Dávid. Nagy vonalakban  C++  
R statisztikai program
1Szegedi Tudományegyetem Természettudományi és Informatikai KarAntal Gábor Programozás I. 1. gyakorlat.
Visual Basic 2008 Express Edition
Komoróczy Tamás 1 Java programozási nyelv A nyelv alapjai.
Fontos információk.
GeoGebra A matematikai szabadszoftver tanuláshoz és tanításhoz
A C++ nyelv.
IT-DEV-CON – Orchard CMS technológiai áttekintése Turóczy Attila Livesoft Kft.
Egyéb interpreterek Windows Script Host Internet Explorer Hypertext application.
Webprogramozó tanfolyam
Webes MES keretrendszer fejlesztése Kiss Miklós Dániel G-5S8 Tervezésvezető: Dr. Hornyák Olivér.
1Szegedi Tudományegyetem Természettudományi és Informatikai KarAntal Gábor Programozás I. 1. gyakorlat.
Illés Zoltán ELTE Informatikai Kar
Java web programozás 5..
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék R „Big Data” elemzési módszerek Kocsis Imre
1Szegedi Tudományegyetem Természettudományi és Informatikai KarAntal Gábor Programozás I. 1. gyakorlat.
.NET FRAMEWORK Röviden Krizsán Zoltán 1.0. Tulajdonságok I Rövidebb fejlesztés 20 támogatott nyelv (nyílt specifikáció) 20 támogatott nyelv (nyílt specifikáció)
JAVA programozási nyelv NetBeans fejlesztőkörnyezetben I/13. évfolyam
Informatikai gyakorlatok 11. évfolyam
Moduláris könyvtári rendszer elektronikus dokumentumgyűjtemények kezeléséhez: az eleMEK projekt Drótos László Perlaki Attila Országos Széchényi Könyvtár,
Assoc. Prof. Ján Gunčaga, PhD. Faculty of Education Catholic University in Ružomberok Nyílt forráskódú szoftverek és IKT az oktatásban.
Analogical and Neural Computing Laboratory, Hungarian Academy of Sciences, Budapest 1 MATLAB u Hatékony, interaktív, tudományos és műszaki számítások,
1 A Twitter és a Facebook API Szolgáltatások és Alkalmazások Ujvárosi Szabolcs 2010.
ILIAS ILIAS OpenSource e-Learning keretrendszer Előadó: Baranyi Tamás IRM Oktatási Főigazgatóság
Programozási nyelvek Általános és speciális. Általános célú programozási nyelvek  olyan programozási nyelvek, amiket széleskörűen fel lehet használni.
kialakulása, fejlődése, generációk
Programok készítése és futtatása. Integrált fejlesztői környezet (IDE) tartalmaz:  szövegszerkesztőt a program forráskódjának szerkesztésére,  fordítóprogramot.
Szöveg beírásához kattintson ide A SCRATCH környezet bemutatása szakköri tapasztalatok alapján Gödöny Péter Budapesti Műszaki Szakképzési Centrum Pataky.
A JaDoX, mint repozitórium szoftver a közgyűjteményi informatikában JaDoX 3 Monguz Portál24 Monguz Kft. Mazula Zoltán.
Alkalmazásfejlesztés F#-ban Dunaújvárosi Főiskola Kiss Gyula mérnökinformatikus hallgató Nemzeti Tehetség Program Tehetségútlevél Program „NTP-TÚP ”
Script nyelvek előadás
Programozási nyelvek Programozási alapismeretek
dr. Siki Zoltán BME Általános és Felsőgeodézia tanszék
Script nyelvek előadás
Script nyelvek előadás
„Big Data” elemzési módszerek
MySQL története, részei, felhasználhatóság, PHPMyAdmin
Előadás másolata:

Webbányászat Pythonban Hornyák Miklós (hornyak.miklos@gmail.com) Web Meetup, Pécs 2014.04.04.

Tartalomjegyzék Bemutatkozás Kígyó vagy giliszta? Csomagoljunk! The Zen of Python Bemutatkozás Kígyó vagy giliszta? Ismerkedés Programozási alapok Csomagoljunk! Package minden problémára Szövegbányászat Az NLTK csomag Nyelvi problémák Projektek GUI és WEB fejlesztés Egyedül nem megy!

Bemutatkozás Pécsi Tudományegyetem Duo mining Kutatócsoport Közgazdaságtudományi Kar, Gazdaság-módszertani Intézet, Gazdaságinformatika Tanszék Duo mining Kutatócsoport Adat és szövegbányászat tandeme Kutatási téma „Területi versenyképesség vizsgálatának támogatása alternatív eszközökkel” Strukturált és strukturálatlan adatok használata Területegységek reprezentációja „Social sensors” és bioinformatikai analógia

Python alapok 1989 óta fejlesztik - közösség! - Guido van Rossum Opensource, portábilis, ingyenes ám korlátozás nélküli használható Magasszintű, jól olvasható szintaktikájú SCRIPT nyelv (pl. Ruby, PHP, Perl, Javascript, UX shellek) Moduláris és objektumorientált programozást is támogatja Dinamikus - interpreter kifejezéseket és karakterláncokat is kiértékel Ortogonális - kevés fogalommal nagyszámú konstrukció alkotható Reflektív - metaprogramozás támogatása: a végrehajtás során képes objektumot módosítani Introspektív - sok Python fejlesztőeszköz Pythonban íródott

Python alapok Implementációk: Verziók - folyamatos fejlődés Használat Python Software Foundation Implementációk: Interpretált - lefordított utasításokat virtuális gép hajtja végre Bytekód generálás – Jython, IronPython Verziók - folyamatos fejlődés 2.7.6 - sok module 3.4.0 – unicode, Qt Használat Interaktív mód Python parancsor - python.exe Grafikus IDE – pl. Eclipse Tudományos közösség kedvelt eszköze Disztribúciók – python(x,y), SciPy, Anaconda, winpython

Python programozás Python zsebkönyv, Kiskapu 2008 "Egy Python program sorait bal szélre igazítani olyan, mint egy szépirodalmi műből kiszedni az írásjeleket és a szóközöket.„ komment Fejlett adattípusok használatát támogtaja: listák, szótárak Tömör kb. harmada a Java kódnak Erőforráskezelés automatikus (memória, fájlok) – „garbage collector” Mutatók nincsenek, de multi-thread lehet. Objektumorientált - többszörös öröklést is támogatja Modern kivételkezelés, dinamikus típusadás – i = 1, i = „1” Case sensitive – Józsi, józsi

Python és a csomagok Telepítés – python setup.py / pip import csomag Rengeteg Python package -> module Cryptography Databases, XML GUI GIS Image Manipulation,PDFMiner Mac, Windows Web NumPy, Matplotlib, Sympy, pandas

Python és IDE Eclipse(www.eclipse.org) PyDev (pydev.org) Javaban írt IDE Plug-inek számos feladathoz Több platformra PyDev (pydev.org) Python IDE az Eclipsehez Type hinting Debugger, stb.

Python és a szövegbányászat Strukturálatlan adatok – pl. e-mail, dokumentumok, weblapok elektronikus adatok Kb. 85%-a strukturálatlan adat Elemzés, feldolgozás, információkinyerés - rejtett NLTK – Natural Language Toolkit Tokenizálás Stopszavazás Szótövezés Part of Speech (POS) – nyelvtani elemzés Named-entity Recognition (NER) – névelem azonosítás Nyelvi problémák HunSpell

Python projektben FOI projekt HírIndex projekt SEARCH projekt Future Orientation Index területegységekre Google Trends keresések alapján Térképi ábrázolás HírIndex projekt Területegységek média reprezentációja Osztályozás – pozitív/negatív hír SEARCH projekt Európai Unió policy notes dokumentumok elemzése Adatvizualizáció

Python és a GUI fejlesztés wxPython wxPython egy GUI toolkit Pythonhoz Opensource Cross-platform Unix, Macintosh OS X, MS Windows Boa Constructor Python IDE és wxPython GUI builder Pythonban készült

Python és a webfejlesztés CGI Library: cgi, cgibt Spagetti kód – Mako, Genshi, Jinja templatek from string import Template template = Template("<html><body><h1>Hello ${name}!</h1></body></html>") print template.substitute(dict(name=‚Web Meetup')) <html><body><h1>Hello Web Meetup</h1></body></html> MySQL, SQLite, PostgreSQL és Object Relational Mapping (ORM) SQLAlchemy Frameworkök Django Zope

Python és a barátai R (http://www.r-project.org/) RapidMiner Statisztikai számítási feladatok elvégzésre Az eredmények ábrázolására Programozás nyelv és környezet (R Studio) GNU project Cross platform RapidMiner Lásd Kovács Balázs előadása – modellalkotás és próba Graphviz (http://www.graphviz.org/) Vizualizációs eszközök – dot, neato, fdp, sfdp, twopi, circo Opensource

Python és webbányászat Köszönöm a figyelmet!