Automatické rozpoznání a vytváření zkratek slov
Název práce v češtině: | Automatické rozpoznání a vytváření zkratek slov |
---|---|
Název v anglickém jazyce: | Automatic Abbreviating and De-abbreviating |
Akademický rok vypsání: | 2017/2018 |
Typ práce: | ročníková práce |
Jazyk práce: | |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. RNDr. Ondřej Bojar, Ph.D. |
Řešitel: |
Zásady pro vypracování |
Příspěvky na sociálních médiích jako Twitter a případně též SMS zprávy jsou omezeny délkou. Uživatelé proto často velmi kreativně zkracují slova, což výrazně komplikuje jakékoli navazující strojové zpracování.
Cílem ročníkového projektu a navazující bakalářské práce je implemetovat systém pro automatickou identifikaci a expanzi zkratek a též pro opačný směr, tj. automatické zkracování slov tak, aby se daná zpráva vešla do požadovaného limitu. V rámci ročníkového projektu je třeba program navrhnout a zapojit do existujího systému pro podporu překladu tweetů (strojový i lidský překlad). V rámci bakalářské práce je třeba úspěšnost zkracování i expanze zkratek empiricky vyhodnotit. |
Seznam odborné literatury |
http://quest.ms.mff.cuni.cz/tweeslate/
Richter, Michal, 2013, Korektor, LINDAT/CLARIN digital library at Institute of Formal and Applied Linguistics, Charles University in Prague, http://hdl.handle.net/11858/00-097C-0000-000D-F67C-5. Další literaturu dodám později. |