|
|
|
||
Cílem přednášky je poskytnout studentům přehled o současném dění a trendech v oblasti Language Data Resources. Budou popsány vybrané typy anotací nad daty korpusové a
slovníkové povahy a bude procvičeno zpracování takových dat pomocí softwarových nástrojů, a to zejména v programovacím jazyce Python. Jednotlivé typy anotací a možnosti jejich
využití budou ilustrovány na předních projektech pro angličtinu, češtinu a některé další jazyky.
Poslední úprava: Vidová Hladká Barbora, doc. Mgr., Ph.D. (25.01.2019)
|
|
||
Pro získání klasifikovaného zápočtu je potřeba dosáhnout alespoň 50% z celkového počtu bodů z písemného testu a odevzdat všechny domácí úkoly. Výsledná známka je založena na neváženém průměru výsledků písemného testu a domácích úkolů, podle následující tabulky: 1: ≥ 90% 2: ≥ 70% 3: ≥ 50% 4: < 50% Pokud například získáte 600 z 1000 bodů za domácí úkoly (60%) a 36 ze 40 bodů za test (90%), vaše celkové skóre je 75% a výsledná známka 2. Podrobnosti naleznete na https://ufal.mff.cuni.cz/courses/npfl070#grading Poslední úprava: Popel Martin, Mgr., Ph.D. (12.06.2019)
|
|
||
Poslední úprava: Vidová Hladká Barbora, doc. Mgr., Ph.D. (25.01.2019)
|
|
||
1. Úvod
2. Korpusy
3. Treebanky
4. Počítačová lexikografie
5. Další typy jazykových dat
6. Tvorba datových zdrojů z pohledu autorských práv, licence Poslední úprava: Vidová Hladká Barbora, doc. Mgr., Ph.D. (25.01.2019)
|