Témata prací (Výběr práce)

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

Automatická extrakce konkordancí z Internetu

Název práce v češtině:	Automatická extrakce konkordancí z Internetu
Název v anglickém jazyce:	Automatic extraction of concordances from the Internet
Klíčová slova:	automatická extrakce, konkordance, internet
Klíčová slova anglicky:	automatic extraction, concordance, internet
Akademický rok vypsání:	2015/2016
Typ práce:	ročníková práce
Jazyk práce:
Ústav:	Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel:	RNDr. Vincent Kríž, Ph.D.
Řešitel:

Zásady pro vypracování

Zvolme libovolné cílové slovo v libovolném jazyce. V tomto projektu pod termínem konkordance myslíme kontext daného cílového slova. Tento kontext můžeme definovat počtem slov (např. 10 slov před a 10 slov za cílovým slovem), počtem vět apod. Jeden příklad za všechny, a sice cílové slovo Espana:

http://brat.nlplab.org/img/concordancing-example.png

Cílem tohto projektu bude zhotovit aplikaci, které na vstupu zadáme cílové slovo a počet konkordancí. Aplikace následně požadované množství konkordancí vyhledá a stáhne z Internetu.

Úkolem řešitele bude především:
- analyzovat vhodné Internetové zdroje pro získávání konkordancí,
- vytvořit command-linovou aplikaci pro Linux,
- vytvořit nástroje pro analyzování výsledků.

Množství a účel nástrojů pro analýzu výsledků bude záviset na specifikaci, kterou spoločně vytvoříme. Větší množství sofistikovanějších nástrojů by umožnilo vytvořit z této práce zadání pro Bakalářskou práci.

Seznam odborné literatury

[1] http://en.wikipedia.org/wiki/Concordance_(publishing)#Use_in_linguistics
[2] Tony McEnery, Andrew Hardie: Corpus Linguistics: Method, Theory and Practice. Cambridge University Press, 6. 10. 2011