SubjectsSubjects(version: 945)
Course, academic year 2023/2024
   Login via CAS
Czech Language and Corpus - APH510052
Title: Český jazyk a korpus
Guaranteed by: Institute of Phonetics (21-FU)
Faculty: Faculty of Arts
Actual: from 2014
Semester: both
Points: 0
E-Credits: 3
Examination process:
Hours per week, examination: 0/2, C [HT]
Capacity: winter:unknown / unknown (unknown)
summer:unknown / unknown (unknown)
Min. number of students: unlimited
4EU+: no
Virtual mobility / capacity: no
Key competences:  
State of the course: not taught
Language: Czech
Teaching methods: full-time
Teaching methods: full-time
Level:  
Is provided by: AMLV00008
Note: you can enroll for the course in winter and in summer semester
Guarantor: Mgr. Jiří Mácha
prof. Mgr. Václav Cvrček, Ph.D.
Mgr. Dominika Kováříková, M.A., Ph.D.
Schedule   Noticeboard   
Annotation - Czech
Last update: Mgr. Lenka Weingartová, Ph.D. (15.09.2014)
Seminář je určen zájemcům o práci s jazykovým korpusem. Po absolvování semináře budou studenti schopni
samostatně využívat korpusy psané a mluvené češtiny pro svou vlastní lingvistickou práci. Naučí se pracovat s
korpusovým manažerem KonText a dalšími nástroji pro práci s korpusem, seznámí se s jazykovým materiálem v
korpusech ČNK (především se synchronními psanými a mluvenými korpusy). V rámci samostatného výzkumu
dokážou vyhledat a interpretovat lingvistický jev.
Počet studentů v semináři je z kapacitních důvodů omezen na 10.

Požadavky k zápočtu: aktivní účast na seminářích, test, samostatné zpracování lingvistického jevu korpusovými
metodami.
Literature - Czech
Last update: Mgr. Lenka Weingartová, Ph.D. (15.09.2014)

Povinná literatura

Baker, P.: Using Corpora in Discourse Analysis. Continuum, London 2006. (úvodní kapitola)

Čermáková, A.: Valence českých substantiv. Studie z korpusové lingvistiky, svazek 9. NLN, Praha 2009. (úvodní kapitola)

Cvrček, V. - Kováříková, D.: Možnosti a meze korpusové lingvistiky. Naše řeč 94/3, 2011 (s. 113-133).

Doporučená literatura

Bartoň, T. a kol.: Statistiky češtiny. NLN, Praha 2009.

Cvrček, V. a kol..: Mluvnice současné češtiny /Grammar of Contemporary Czech/. Karolinum. Praha 2010, (353 s.).

Biber, D. et al.: Corpus Linguistics: Investigating Language Structure and Use. Cambridge University Press, Cambridge 1998.

Oakes, M. P.: Statistics for Corpus Linguistics. Edinburg University Press, Edinburg 1998.

Teubert, W. - Krishnamurthy, R. (eds.): Corpus Linguistics Vol. I-VI. Critical Concepts in Linguistics, Routledge 2007.

Syllabus - Czech
Last update: Mgr. Lenka Weingartová, Ph.D. (15.09.2014)

Rozpis témat

Následující témata budou při vyučování pokryta. Každý vyučující má individuální přístup k rozvržení hodin (pořadí témat) i v důrazu na jednotlivá témata.

  • Co je korpus; korpusy ČNK
  • Korpusová lingvistika
  • Otázka reprezentativnosti psaných a mluvených korpusů, žánrová rozrůzněnost
  • Značkování korpusu - lemmatizace a morfologické značkování; struktura korpusu
  • Vyhledání a interpretace konkordance
  • Frekvenční analýza (lemmat, slovních tvarů, žánrů, kontextu apod.)
  • Pokročilé vyhledávání: CQL a regulární výrazy
  • Kolokace, koligace, sémantická prozodie
  • Korpusový materiál ve výzkumu jednotlivých jazykových rovin
  • Základy zpracování dat (práce s Excelem, vytváření tabulek a grafů)
  • Základy statistiky pro práci s korpusem
  • Korpusové nástroje SyD, Morfio, KWords
  • Specializované korpusy (Diakorp, InterCorp, autorské korpusy)
  • Zpracování rozsáhlejšího lingvistického výzkumu (např. bakalářská/diplomová práce) na základě korpusových dat

 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html