Poloautomatická analýza struktury textu
Thesis title in Czech: | Poloautomatická analýza struktury textu |
---|---|
Thesis title in English: | Half-automatic recognition of text structure |
Academic year of topic announcement: | 2008/2009 |
Thesis type: | diploma thesis |
Thesis language: | čeština |
Department: | Department of Applied Mathematics (32-KAM) |
Supervisor: | doc. Mgr. Petr Kolman, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 29.09.2008 |
Date of assignment: | 29.09.2008 |
Date and time of defence: | 24.05.2010 00:00 |
Date of electronic submission: | 24.05.2010 |
Date of proceeded defence: | 24.05.2010 |
Opponents: | prof. RNDr. Tomáš Skopal, Ph.D. |
Guidelines |
Diplomant se seznámí se známými technikami zpracování a analýzy XML-dokumentů
a aplikuje je při návrhu a implementaci softwarového nástroje pro poloautomatické zpracování realitní inzerce přístupné na internetu. |
References |
Michel C. A. Klein:
Interpreting XML Documents via an RDF Schema Ontology Proceedings of the 13th International Workshop on Database and Expert Systems Applications Pages: 889 - 894, 2002 ISBN:0-7695-1668-8 Luis Francisco-Revilla, Frank Shipman: Parsing and interpreting ambiguous structures in spatial hypermedia Proceedings of the sixteenth ACM conference on Hypertext and hypermedia Pages: 107 - 116, 2005 ISBN:1-59593-168-6 Dále dle upřesnění školitele |
Preliminary scope of work |
Diplomant navrhne a naimplementuje nástroj pro poloautomatické rozpoznávání a
klasifikaci realitních inzerátů dostupných na webových serverech. Nástroj by měl být schopen po zadání adresy libovolného (neznámého) serveru a po "nápovědě" uživatele (např. v podobě označení některých částí stránky) vyhledat dostupné inzeráty na daném serveru a pro každý z nich rozpoznat jeho klíčové části (cena, kontakt, lokalita ap.). |
Preliminary scope of work in English |
The student will design and implement a software tool for half-automated
recognition and classification of real estate advertisements that are available on Internet. |