PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Technologie pro NLP - NPFL092
Anglický název: NLP Technology
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2021
Semestr: zimní
E-Kredity: 5
Rozsah, examinace: zimní s.:1/2, KZ [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: zrušen
Jazyk výuky: angličtina, čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Další informace: https://ufal.mff.cuni.cz/courses/npfl092
Garant: doc. Ing. Zdeněk Žabokrtský, Ph.D.
Mgr. Rudolf Rosa, Ph.D.
Třída: Informatika Bc.
Informatika Mgr. - Matematická lingvistika
Kategorizace předmětu: Informatika > Počítačová a formální lingvistika
Neslučitelnost : NPFL125
Záměnnost : NPFL125
Je neslučitelnost pro: NPFL125
Je záměnnost pro: NPFL125
Výsledky anket   Termíny zkoušek   Rozvrh   Nástěnka   
Anotace -
Poslední úprava: T_UFAL (10.05.2010)
Posluchači se seznámí se základními softwarovými nástroji používanými při zpracování přirozeného jazyka. Praktické zvládnutí těchto nástrojů bude očekáváno v dalších předmětech oboru Matematická lingvistika.
Podmínky zakončení předmětu -
Poslední úprava: doc. Ing. Zdeněk Žabokrtský, Ph.D. (29.10.2019)

Pro splnění předmětu je nutné odevzdat domácí úkoly a absolvovat písemný test. Stručný popis následuje níže, detailní informace o hodnocení jsou k dispozici na https://ufal.mff.cuni.cz/courses/npfl092#grading

Domácí úkoly

  • Úkoly budou zadány na hodině, jejich specifikace bude také na webové stránce předmětu.
  • Pro úspěšné absolvování předmětu je nutné získat celkově alespoň 50 procent ze součtu možných bodů za všechny domácí úkoly.
  • Při nedodržení termínu na odevzdání úkolu se termín prodlužuje o dva týdny, ale body získané z úkolu se dělí dvěma. Po uplynutí prodlouženého termínu nelze za daný úkol získat už žádné body.

Test

  • Na konci semestru bude zadán písemný test.
  • Pro úspěšné absolvování předmětu je nutné z testu získat alespoň 50 procent bodů.

Známkování

  • Známka vyplývá z průměru procentních úspěšností za domácí úkoly a za test (písemný test má stejnou váhu jako všechny domácí úkoly).
  • ≥ 90 %: výborně
  • ≥ 70 %: velmi dobře
  • ≥ 50 %: dobře
  • < 50 %: neprospěl/a
Literatura -
Poslední úprava: T_UFAL (05.05.2017)

Mendel Cooper: Advanced Bash-Scripting Guide, http://tldp.org/LDP/abs/html/

Allen B. Downey: Think Python 2e, O'Reilly Media, http://greenteapress.com/wp/think-python-2e/

Steven Bird, Ewan Klein, and Edward Loper: Natural Language Processing with Python, O'Reilly Media, 2015, http://www.nltk.org/book/

Dive into NLTK: http://textminingonline.com/dive-into-nltk-part-i-getting-started-with-nltk

Sylabus -
Poslední úprava: T_UFAL (05.05.2017)

Základní orientace v prostředí Linuxu, práce na příkazové řádce Bash, příkazy pro zpracování textových souborů.

Úvod do programovacího jazyka Python, práce s textem, regulární výrazy.

Objektové rozhraní pro práci s lingvistickými strukturami v Pythonu.

Reprezentace lingvistických struktur v XML, zpracování XML v Pythonu.

NLP nástroje a frameworky, práce s morfologicky a syntakticky značkovanými daty, vizualizace, vyhledávání.

 
Univerzita Karlova | Informační systém UK