PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Zpracování přirozeného jazyka na výpočetním clusteru - NPFL118
Anglický název: Natural language processing on computational cluster
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2022
Semestr: zimní
E-Kredity: 3
Rozsah, examinace: zimní s.:0/2, Z [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: čeština, angličtina
Způsob výuky: prezenční
Způsob výuky: prezenční
Další informace: http://ufal.mff.cuni.cz/courses/npfl118
Garant: RNDr. Milan Straka, Ph.D.
Mgr. Martin Popel, Ph.D.
Mgr. Rudolf Rosa, Ph.D.
Anotace -
Poslední úprava: T_UFAL (04.05.2017)
Cílem předmětu je seznámit studenty s postupy potřebnými při zpracování přirozeného jazyka (zpracování velkých dat v distribuovaném prostředí a strojové učení) a předvést, jak je efektivně provádět v prostředí linuxového výpočetního clusteru Ústavu formální a aplikované lingvistiky (ÚFAL). Kurz bude věnován síťové architektuře a architektuře clusteru, SGE (Sun/Oracle/Son of Grid Engine), souvisejícím linuxových nástrojům a zavedeným postupům. Celý předmět bude odučen v několika prvních týdnech semestru.
Podmínky zakončení předmětu -
Poslední úprava: Mgr. Rudolf Rosa, Ph.D. (26.09.2022)

Vypracování zadaných úkolů a aktivní účast na semináři.

Pro smysluplnou účast na kurzu a možnost splnění úkolů je nutné mít přístup na výpočetní cluster ÚFAL, kurz je proto velmi vhodný pro doktorské studenty ÚFAL, pro jiné studenty je naopak, až na výjimečné případy, nevhodný.

Literatura -
Poslední úprava: Mgr. Martin Popel, Ph.D. (01.10.2022)

Data-Intensive Text Processing with MapReduce; Jimmy Lin and Chris Dyer.; Morgan & Claypool Publishers, 2010

Slurm - https://slurm.schedmd.com/

Apache Spark - https://spark.apache.org/

TensorFlow - https://www.tensorflow.org/

Sylabus -
Poslední úprava: Mgr. Martin Popel, Ph.D. (01.10.2022)

Technologické problémy při zpracování velkého objemu dat

Síťová architektura a architektura clusteru Ústavu formální a aplikované lingvistiky (ÚFAL)

Slurm - architektura, příkazy

 
Univerzita Karlova | Informační systém UK