Poloautomatická analýza struktury textu
Název práce v češtině: | Poloautomatická analýza struktury textu |
---|---|
Název v anglickém jazyce: | Half-automatic recognition of text structure |
Akademický rok vypsání: | 2008/2009 |
Typ práce: | diplomová práce |
Jazyk práce: | čeština |
Ústav: | Katedra aplikované matematiky (32-KAM) |
Vedoucí / školitel: | doc. Mgr. Petr Kolman, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 29.09.2008 |
Datum zadání: | 29.09.2008 |
Datum a čas obhajoby: | 24.05.2010 00:00 |
Datum odevzdání elektronické podoby: | 24.05.2010 |
Datum proběhlé obhajoby: | 24.05.2010 |
Oponenti: | prof. RNDr. Tomáš Skopal, Ph.D. |
Zásady pro vypracování |
Diplomant se seznámí se známými technikami zpracování a analýzy XML-dokumentů
a aplikuje je při návrhu a implementaci softwarového nástroje pro poloautomatické zpracování realitní inzerce přístupné na internetu. |
Seznam odborné literatury |
Michel C. A. Klein:
Interpreting XML Documents via an RDF Schema Ontology Proceedings of the 13th International Workshop on Database and Expert Systems Applications Pages: 889 - 894, 2002 ISBN:0-7695-1668-8 Luis Francisco-Revilla, Frank Shipman: Parsing and interpreting ambiguous structures in spatial hypermedia Proceedings of the sixteenth ACM conference on Hypertext and hypermedia Pages: 107 - 116, 2005 ISBN:1-59593-168-6 Dále dle upřesnění školitele |
Předběžná náplň práce |
Diplomant navrhne a naimplementuje nástroj pro poloautomatické rozpoznávání a
klasifikaci realitních inzerátů dostupných na webových serverech. Nástroj by měl být schopen po zadání adresy libovolného (neznámého) serveru a po "nápovědě" uživatele (např. v podobě označení některých částí stránky) vyhledat dostupné inzeráty na daném serveru a pro každý z nich rozpoznat jeho klíčové části (cena, kontakt, lokalita ap.). |
Předběžná náplň práce v anglickém jazyce |
The student will design and implement a software tool for half-automated
recognition and classification of real estate advertisements that are available on Internet. |