Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Automatické rozpoznání a vytváření zkratek slov
Název práce v češtině: Automatické rozpoznání a vytváření zkratek slov
Název v anglickém jazyce: Automatic Abbreviating and De-abbreviating
Akademický rok vypsání: 2017/2018
Typ práce: ročníková práce
Jazyk práce:
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. RNDr. Ondřej Bojar, Ph.D.
Řešitel:
Zásady pro vypracování
Příspěvky na sociálních médiích jako Twitter a případně též SMS zprávy jsou omezeny délkou. Uživatelé proto často velmi kreativně zkracují slova, což výrazně komplikuje jakékoli navazující strojové zpracování.

Cílem ročníkového projektu a navazující bakalářské práce je implemetovat systém pro automatickou identifikaci a expanzi zkratek a též pro opačný směr, tj. automatické zkracování slov tak, aby se daná zpráva vešla do požadovaného limitu.

V rámci ročníkového projektu je třeba program navrhnout a zapojit do existujího systému pro podporu překladu tweetů (strojový i lidský překlad). V rámci bakalářské práce je třeba úspěšnost zkracování i expanze zkratek empiricky vyhodnotit.
Seznam odborné literatury
http://quest.ms.mff.cuni.cz/tweeslate/

Richter, Michal, 2013, Korektor, LINDAT/CLARIN digital library at Institute of Formal and Applied Linguistics, Charles University in Prague, http://hdl.handle.net/11858/00-097C-0000-000D-F67C-5.

Další literaturu dodám později.
 
Univerzita Karlova | Informační systém UK