PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Český jazyk a korpus - APH510052
Anglický název: Czech Language and Corpus
Zajišťuje: Fonetický ústav (21-FU)
Fakulta: Filozofická fakulta
Platnost: od 2014
Semestr: oba
Body: 0
E-Kredity: 3
Způsob provedení zkoušky:
Rozsah, examinace: 0/2, Z [HT]
Počet míst: zimní:neurčen / neurčen (neurčen)
letní:neurčen / neurčen (neurčen)
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Kompetence:  
Stav předmětu: nevyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Úroveň:  
Je zajišťováno předmětem: AMLV00008
Poznámka: předmět lze zapsat v ZS i LS
Garant: Mgr. Jiří Mácha
prof. Mgr. Václav Cvrček, Ph.D.
Mgr. Dominika Kováříková, M.A., Ph.D.
Rozvrh   Nástěnka   
Anotace
Poslední úprava: Mgr. Lenka Weingartová, Ph.D. (15.09.2014)
Seminář je určen zájemcům o práci s jazykovým korpusem. Po absolvování semináře budou studenti schopni
samostatně využívat korpusy psané a mluvené češtiny pro svou vlastní lingvistickou práci. Naučí se pracovat s
korpusovým manažerem KonText a dalšími nástroji pro práci s korpusem, seznámí se s jazykovým materiálem v
korpusech ČNK (především se synchronními psanými a mluvenými korpusy). V rámci samostatného výzkumu
dokážou vyhledat a interpretovat lingvistický jev.
Počet studentů v semináři je z kapacitních důvodů omezen na 10.

Požadavky k zápočtu: aktivní účast na seminářích, test, samostatné zpracování lingvistického jevu korpusovými
metodami.
Literatura
Poslední úprava: Mgr. Lenka Weingartová, Ph.D. (15.09.2014)

Povinná literatura

Baker, P.: Using Corpora in Discourse Analysis. Continuum, London 2006. (úvodní kapitola)

Čermáková, A.: Valence českých substantiv. Studie z korpusové lingvistiky, svazek 9. NLN, Praha 2009. (úvodní kapitola)

Cvrček, V. - Kováříková, D.: Možnosti a meze korpusové lingvistiky. Naše řeč 94/3, 2011 (s. 113-133).

Doporučená literatura

Bartoň, T. a kol.: Statistiky češtiny. NLN, Praha 2009.

Cvrček, V. a kol..: Mluvnice současné češtiny /Grammar of Contemporary Czech/. Karolinum. Praha 2010, (353 s.).

Biber, D. et al.: Corpus Linguistics: Investigating Language Structure and Use. Cambridge University Press, Cambridge 1998.

Oakes, M. P.: Statistics for Corpus Linguistics. Edinburg University Press, Edinburg 1998.

Teubert, W. - Krishnamurthy, R. (eds.): Corpus Linguistics Vol. I-VI. Critical Concepts in Linguistics, Routledge 2007.

Sylabus
Poslední úprava: Mgr. Lenka Weingartová, Ph.D. (15.09.2014)

Rozpis témat

Následující témata budou při vyučování pokryta. Každý vyučující má individuální přístup k rozvržení hodin (pořadí témat) i v důrazu na jednotlivá témata.

  • Co je korpus; korpusy ČNK
  • Korpusová lingvistika
  • Otázka reprezentativnosti psaných a mluvených korpusů, žánrová rozrůzněnost
  • Značkování korpusu - lemmatizace a morfologické značkování; struktura korpusu
  • Vyhledání a interpretace konkordance
  • Frekvenční analýza (lemmat, slovních tvarů, žánrů, kontextu apod.)
  • Pokročilé vyhledávání: CQL a regulární výrazy
  • Kolokace, koligace, sémantická prozodie
  • Korpusový materiál ve výzkumu jednotlivých jazykových rovin
  • Základy zpracování dat (práce s Excelem, vytváření tabulek a grafů)
  • Základy statistiky pro práci s korpusem
  • Korpusové nástroje SyD, Morfio, KWords
  • Specializované korpusy (Diakorp, InterCorp, autorské korpusy)
  • Zpracování rozsáhlejšího lingvistického výzkumu (např. bakalářská/diplomová práce) na základě korpusových dat

 
Univerzita Karlova | Informační systém UK