PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Český jazyk a korpus - AMLV00008
Anglický název: Czech Language and Corpus
Zajišťuje: Ústav českého národního korpusu (21-UCNK)
Fakulta: Filozofická fakulta
Platnost: od 2019
Semestr: oba
Body: 2
E-Kredity: 3
Způsob provedení zkoušky:
Rozsah, examinace: 0/2, Z [HT]
Rozsah za akademický rok: 2 [hodiny]
Počet míst: zimní:neurčen / neurčen (10)
letní:neurčen / neurčen (10)
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Kompetence:  
Stav předmětu: nevyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Úroveň:  
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
předmět lze zapsat v ZS i LS
Garant: prof. Mgr. Václav Cvrček, Ph.D.
Mgr. Michal Křen, Ph.D.
Třída: A - Mezioborová nabídka VP: Lingvistika
Rozvrh   Nástěnka   
Anotace -
Poslední úprava: Mgr. Lucie Lukešová, Ph.D. (07.02.2014)
Seminář je určen bohemistům a dalším zájemcům o práci s jazykovým korpusem. Po absolvování semináře budou studenti schopni samostatně využívat korpusy psané a mluvené češtiny pro svou vlastní lingvistickou práci. Naučí se pracovat s korpusovým manažerem KonText a dalšími nástroji pro práci s korpusem, seznámí se s jazykovým materiálem v korpusech ČNK (především se synchronními psanými a mluvenými korpusy). V rámci samostatného výzkumu dokážou vyhledat a interpretovat lingvistický jev.
Počet studentů v semináři je z kapacitních důvodů omezen na 10.

Požadavky k zápočtu: aktivní účast na seminářích, test, samostatné zpracování lingvistického jevu korpusovými metodami.
Literatura -
Poslední úprava: Mgr. Lucie Lukešová, Ph.D. (07.02.2014)

Povinná literatura

Baker, P.: Using Corpora in Discourse Analysis. Continuum, London 2006. (úvodní kapitola)

Čermáková, A.: Valence českých substantiv. Studie z korpusové lingvistiky, svazek 9. NLN, Praha 2009. (úvodní kapitola)

Cvrček, V. - Kováříková, D.: Možnosti a meze korpusové lingvistiky. Naše řeč 94/3, 2011 (s. 113-133).

Doporučená literatura

Bartoň, T. a kol.: Statistiky češtiny. NLN, Praha 2009.

Cvrček, V. a kol..: Mluvnice současné češtiny /Grammar of Contemporary Czech/. Karolinum. Praha 2010, (353 s.).

Biber, D. et al.: Corpus Linguistics: Investigating Language Structure and Use. Cambridge University Press, Cambridge 1998.

Oakes, M. P.: Statistics for Corpus Linguistics. Edinburg University Press, Edinburg 1998.

Teubert, W. - Krishnamurthy, R. (eds.): Corpus Linguistics Vol. I-VI. Critical Concepts in Linguistics, Routledge 2007.

Sylabus -
Poslední úprava: Mgr. Lucie Lukešová, Ph.D. (07.02.2014)

Rozpis témat

Následující témata budou při vyučování pokryta. Každý vyučující má individuální přístup k rozvržení hodin (pořadí témat) i v důrazu na jednotlivá témata.

·         Co je korpus; korpusy ČNK

·         Korpusová lingvistika

·         Otázka reprezentativnosti psaných a mluvených korpusů, žánrová rozrůzněnost

·         Značkování korpusu - lemmatizace a morfologické značkování; struktura korpusu

·         Vyhledání a interpretace konkordance

·         Frekvenční analýza (lemmat, slovních tvarů, žánrů, kontextu apod.)

·         Pokročilé vyhledávání: CQL a regulární výrazy

·         Kolokace, koligace, sémantická prozodie

·         Korpusový materiál ve výzkumu jednotlivých jazykových rovin

·         Základy zpracování dat (práce s Excelem, vytváření tabulek a grafů)

·         Základy statistiky pro práci s korpusem

·         Korpusové nástroje SyD, Morfio, KWords

·         Specializované korpusy (Diakorp, InterCorp, autorské korpusy)

·         Zpracování rozsáhlejšího lingvistického výzkumu (např. bakalářská/diplomová práce) na základě korpusových dat

 
Univerzita Karlova | Informační systém UK