PředmětyPředměty(verze: 861)
Předmět, akademický rok 2019/2020
  
Zpracování textu v UNIXu - NPFL125
Anglický název: Text processing in UNIX
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2018
Semestr: zimní
E-Kredity: 3
Rozsah, examinace: zimní s.:0/2 KZ [hodiny/týden]
Počet míst: neomezen
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: čeština, angličtina
Způsob výuky: prezenční
Další informace: https://ufal.mff.cuni.cz/courses/npfl125
Garant: doc. Ing. Zdeněk Žabokrtský, Ph.D.
Neslučitelnost : NPFL092
Záměnnost : NPFL092
N//Je neslučitelnost pro: NPFL092
Z//Je záměnnost pro: NPFL092
Anotace -
Poslední úprava: Mgr. Barbora Vidová Hladká, Ph.D. (03.05.2019)
Posluchači se seznámí se základními softwarovými nástroji vhodnými pro automatické zpracování přirozeného jazyka v unixových systémech.
Podmínky zakončení předmětu -
Poslední úprava: doc. Ing. Zdeněk Žabokrtský, Ph.D. (29.10.2019)

Pro splnění předmětu je nutné odevzdat domácí úkoly a absolvovat písemný test. Stručný popis následuje níže, detailní informace o hodnocení jsou k dispozici na https://ufal.mff.cuni.cz/courses/npfl092#grading

Domácí úkoly

  • Úkoly budou zadány na hodině, jejich specifikace bude také na webové stránce předmětu.
  • Pro úspěšné absolvování předmětu je nutné získat celkově alespoň 50 procent ze součtu možných bodů za všechny domácí úkoly.
  • Při nedodržení termínu na odevzdání úkolu se termín prodlužuje o dva týdny, ale body získané z úkolu se dělí dvěma. Po uplynutí prodlouženého termínu nelze za daný úkol získat už žádné body.

Test

  • Na konci semestru bude zadán písemný test.
  • Pro úspěšné absolvování předmětu je nutné z testu získat alespoň 50 procent bodů.

Známkování

  • Známka vyplývá z průměru procentních úspěšností za domácí úkoly a za test (písemný test má stejnou váhu jako všechny domácí úkoly).
  • ≥ 90 %: výborně
  • ≥ 70 %: velmi dobře
  • ≥ 50 %: dobře
  • < 50 %: neprospěl/a
Literatura -
Poslední úprava: Mgr. Barbora Vidová Hladká, Ph.D. (25.01.2018)

Mendel Cooper: Advanced Bash-Scripting Guide, http://tldp.org/LDP/abs/html/

Allen B. Downey: Think Python 2e, O'Reilly Media, http://greenteapress.com/wp/think-python-2e/

Steven Bird, Ewan Klein, and Edward Loper: Natural Language Processing with Python, O'Reilly Media, 2015, http://www.nltk.org/book/

Dive into NLTK: http://textminingonline.com/dive-into-nltk-part-i-getting-started-with-nltk

Sylabus -
Poslední úprava: Mgr. Barbora Vidová Hladká, Ph.D. (25.01.2018)

Základní orientace v prostředí Linuxu, práce na příkazové řádce Bash, příkazy pro zpracování textových souborů.

Úvod do programovacího jazyka Python, práce s textem, regulární výrazy.

Reprezentace lingvistických struktur v XML a JSON, zpracování XML a JSON v Pythonu.

Vybrané nástroje pro analýzu textu, práce s morfologicky a syntakticky značkovanými daty, vizualizace, vyhledávání.

 
Univerzita Karlova | Informační systém UK