Vytvořte nástroj pro analýzu příchozí pošty, její klasifikaci, a získávání vybraných údajů z těla příchozích zpráv.
Seznam odborné literatury
1. Ronen Feldman, James Sanger: The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data. Cambridge University Press, 2006.
2. Martin Pilát: Získávání a správa údajů o konferencích a workshopech. Bakalářská práce, MFF UK, 2007.
3. Anne Kao, Steve R. Poteet (Eds.): Natural Language Processing and Text Mining, Springer, 2006.
Předběžná náplň práce
Příchozí e-mailové zprávy je možné rozdělit do několika základních typů: osobní sdělení, obecné informace (užitečné i spam), požadavky a potvrzení. Tato práce je zaměřená na získávání dat o vybraných aktivitách z obecných zpráv. Těmito aktivitami jsou např. výzvy k zasílání příspěvků na konference, výzvy k pořádání workshopů, k psaní kapitol do knih, k účasti na konferencích a workshopech, informace o nových časopisech, o volných místech, atd. Cílem práce je takovéto zprávy určit a případně v nich vyhledat užitečné informace.
Předběžná náplň práce v anglickém jazyce
Incoming e-mail messages are of several basic types: personal messages, general information (useful and spam), requests, and acknowledgements. This work will focus useful general information messages concerning some activities: call for papers, workshops, chapters, and participation, new journals, jobs, etc. and on mining data about these topics. Goal of the work it to determine such messages and conditionally search them for useful information.