PředmětyPředměty(verze: 845)
Předmět, akademický rok 2018/2019
   Přihlásit přes CAS
Technologie pro NLP - NPFL092
Anglický název: NLP Technology
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2018
Semestr: zimní
E-Kredity: 5
Rozsah, examinace: zimní s.:1/2 KZ [hodiny/týden]
Počet míst: neomezen
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: čeština, angličtina
Způsob výuky: prezenční
Další informace: https://ufal.mff.cuni.cz/courses/npfl092
Garant: doc. Ing. Zdeněk Žabokrtský, Ph.D.
Mgr. Rudolf Rosa, Ph.D.
Třída: Informatika Bc.
Informatika Mgr. - Matematická lingvistika
Kategorizace předmětu: Informatika > Počítačová a formální lingvistika
Neslučitelnost : NPFL125
Záměnnost : NPFL125
Je neslučitelnost pro: NPFL125
Je záměnnost pro: NPFL125
Anotace -
Poslední úprava: T_UFAL (10.05.2010)
Posluchači se seznámí se základními softwarovými nástroji používanými při zpracování přirozeného jazyka. Praktické zvládnutí těchto nástrojů bude očekáváno v dalších předmětech oboru Matematická lingvistika.
Podmínky zakončení předmětu - angličtina
Poslední úprava: Mgr. Rudolf Rosa, Ph.D. (02.10.2018)

To pass the course. you will need to submit homework assignments and do a written test. A brief overview follows; detailed information on grading can be found at https://ufal.mff.cuni.cz/courses/npfl092#grading

Homework assignments

  • Assignments will be set in the class and specified on the website.
  • To pass the course, you need to get at least 50% of the total achievable points for the assignments.
  • If you miss the deadline, there is a second deadline in 2 weeks, but your points for the assignment will be multiplied by 0.5; after the second deadline, you get 0 points.

Test

  • There will be a written test at the end of the semester.
  • To pass the course, you need to get at least 50% of the total points from the test.

Grading

  • Your grade is based on the average of your performance; the test and the homework assignments are weighted 1:1.
  • ≥ 90%: grade 1 (excellent)
  • ≥ 70%: grade 2 (very good)
  • ≥ 50%: grade 3 (good)
  • < 50%: grade 4 (fail)
Literatura -
Poslední úprava: T_UFAL (05.05.2017)

Mendel Cooper: Advanced Bash-Scripting Guide, http://tldp.org/LDP/abs/html/

Allen B. Downey: Think Python 2e, O'Reilly Media, http://greenteapress.com/wp/think-python-2e/

Steven Bird, Ewan Klein, and Edward Loper: Natural Language Processing with Python, O'Reilly Media, 2015, http://www.nltk.org/book/

Dive into NLTK: http://textminingonline.com/dive-into-nltk-part-i-getting-started-with-nltk

Sylabus -
Poslední úprava: T_UFAL (05.05.2017)

Základní orientace v prostředí Linuxu, práce na příkazové řádce Bash, příkazy pro zpracování textových souborů.

Úvod do programovacího jazyka Python, práce s textem, regulární výrazy.

Objektové rozhraní pro práci s lingvistickými strukturami v Pythonu.

Reprezentace lingvistických struktur v XML, zpracování XML v Pythonu.

NLP nástroje a frameworky, práce s morfologicky a syntakticky značkovanými daty, vizualizace, vyhledávání.

 
Univerzita Karlova | Informační systém UK