Automatická extrakce konkordancí z Internetu
Název práce v češtině: | Automatická extrakce konkordancí z Internetu |
---|---|
Název v anglickém jazyce: | Automatic extraction of concordances from the Internet |
Klíčová slova: | automatická extrakce, konkordance, internet |
Klíčová slova anglicky: | automatic extraction, concordance, internet |
Akademický rok vypsání: | 2015/2016 |
Typ práce: | ročníková práce |
Jazyk práce: | |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | RNDr. Vincent Kríž, Ph.D. |
Řešitel: |
Zásady pro vypracování |
Zvolme libovolné cílové slovo v libovolném jazyce. V tomto projektu pod termínem konkordance myslíme kontext daného cílového slova. Tento kontext můžeme definovat počtem slov (např. 10 slov před a 10 slov za cílovým slovem), počtem vět apod. Jeden příklad za všechny, a sice cílové slovo Espana:
http://brat.nlplab.org/img/concordancing-example.png Cílem tohto projektu bude zhotovit aplikaci, které na vstupu zadáme cílové slovo a počet konkordancí. Aplikace následně požadované množství konkordancí vyhledá a stáhne z Internetu. Úkolem řešitele bude především: - analyzovat vhodné Internetové zdroje pro získávání konkordancí, - vytvořit command-linovou aplikaci pro Linux, - vytvořit nástroje pro analyzování výsledků. Množství a účel nástrojů pro analýzu výsledků bude záviset na specifikaci, kterou spoločně vytvoříme. Větší množství sofistikovanějších nástrojů by umožnilo vytvořit z této práce zadání pro Bakalářskou práci. |
Seznam odborné literatury |
[1] http://en.wikipedia.org/wiki/Concordance_(publishing)#Use_in_linguistics
[2] Tony McEnery, Andrew Hardie: Corpus Linguistics: Method, Theory and Practice. Cambridge University Press, 6. 10. 2011 |