SubjectsSubjects(version: 845)
Course, academic year 2018/2019
   Login via CAS
Automatic Text Data Processing - ATKL00345
Title in English: Automatické zpracování textových dat
Guaranteed by: Institute of Theoretical and Computational Linguistics (21-UTKL)
Faculty: Faculty of Arts
Actual: from 2013
Semester: summer
Points: 0
E-Credits: 6
Examination process: summer s.:oral
Hours per week, examination: summer s.:2/2 C+Ex [hours/week]
Capacity: unlimited / unlimited (unknown)
Min. number of students: unlimited
State of the course: taught
Language: Czech
Teaching methods: full-time
Level:  
Additional information: http://www.mff.cuni.cz/vnitro/is/sis/predmety/kod.php?kod=PFL098
Note: course can be enrolled in outside the study plan
enabled for web enrollment
Guarantor: Mgr. Pavel Straňák, Ph.D.
Teacher(s): Mgr. Pavel Straňák, Ph.D.
Annotation - Czech
Last update: RNDr. Hana Skoumalová, Ph.D. (01.10.2010)
Posluchači se seznámí se základními nástroji pro automatické
zpracování textu. Získané dovednosti by měly usnadnit samostatnou
vědeckou práci i případné další studium počítačové lingvistiky, kde se
praktické zvádnutí těchto nástojů předpokládá.

Syllabus - Czech
Last update: RNDr. Hana Skoumalová, Ph.D. (01.10.2010)

Na ukázkových textech většího rozsahu si ukážeme

základní metody zpracování textu potřebné pro získání netriviálních

informací a ověření hypotéz. Pravděpodobně použijeme texty děl Karla

Čapka a různá další díla v jazycích dle zaměření frekventantů.

  • Zpracování textu jako nutný základ (nejen) komputační linvistiky
  • Proč používat unixový shell; nejzákladnější příkazy
  • další příkazy pro manipulaci s texty
  • textové editory
  • vyhledávání pomocí regulárních výrazů
  • využití regulárních výrazů pro úpravy textu
  • základní principy formulace a ověřování hypotéz, aplikace na data, přesnost, úplnost, vypovídací hodnota výsledků
  • odstranění diakritiky, segmentace na věty, tokenizace
  • pravidlové automatické určení slovních druhů

 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html