Předměty

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

Korpusová lingvistika - úvod zaměřený na češtinu - ALINV152B

Anglický název:	Corpus linguistics - introduction focused on Czech
Zajišťuje:	Ústav obecné lingvistiky (21-ULING)
Fakulta:	Filozofická fakulta
Platnost:	od 2019
Semestr:	oba
Body:	0
E-Kredity:	4
Způsob provedení zkoušky:
Rozsah, examinace:	0/2, Zk [HT]
Počet míst:	zimní:neurčen / neurčen (neurčen) letní:neurčen / neurčen (neurčen)
Minimální obsazenost:	neomezen
4EU+:	ne
Virtuální mobilita / počet míst pro virtuální mobilitu:	ne
Kompetence:
Stav předmětu:	nevyučován
Jazyk výuky:	čeština
Způsob výuky:	prezenční
Způsob výuky:	prezenční
Úroveň:
Je zajišťováno předmětem:	AMLV00008
Vysvětlení:	Další informace lze najít po kliknutí na kód předmětu, který výuku zajišťuje.
Poznámka:	předmět je možno zapsat mimo plán povolen pro zápis po webu předmět lze zapsat v ZS i LS

Garant:	prof. Mgr. Václav Cvrček, Ph.D.
Neslučitelnost :	ALF400086, ALF400222, ALF400223

Rozvrh Nástěnka

Anotace -

Poslední úprava: Mgr. Lucie Lukešová, Ph.D. (07.02.2014)

Seminář je určen bohemistům a dalším zájemcům o práci s jazykovým korpusem. Po absolvování semináře budou studenti schopni samostatně využívat korpusy psané a mluvené češtiny pro svou vlastní lingvistickou práci. Naučí se pracovat s korpusovým manažerem KonText a dalšími nástroji pro práci s korpusem, seznámí se s jazykovým materiálem v korpusech ČNK (především se synchronními psanými a mluvenými korpusy). V rámci samostatného výzkumu dokážou vyhledat a interpretovat lingvistický jev.
Počet studentů v semináři je z kapacitních důvodů omezen na 10.

Požadavky k zápočtu: aktivní účast na seminářích, test, samostatné zpracování lingvistického jevu korpusovými metodami.

Literatura -

Poslední úprava: Mgr. Lucie Lukešová, Ph.D. (07.02.2014)

Povinná literatura

Baker, P.: Using Corpora in Discourse Analysis. Continuum, London 2006. (úvodní kapitola)

Čermáková, A.: Valence českých substantiv. Studie z korpusové lingvistiky, svazek 9. NLN, Praha 2009. (úvodní kapitola)

Cvrček, V. - Kováříková, D.: Možnosti a meze korpusové lingvistiky. Naše řeč 94/3, 2011 (s. 113-133).

Doporučená literatura

Bartoň, T. a kol.: Statistiky češtiny. NLN, Praha 2009.

Cvrček, V. a kol..: Mluvnice současné češtiny /Grammar of Contemporary Czech/. Karolinum. Praha 2010, (353 s.).

Biber, D. et al.: Corpus Linguistics: Investigating Language Structure and Use. Cambridge University Press, Cambridge 1998.

Oakes, M. P.: Statistics for Corpus Linguistics. Edinburg University Press, Edinburg 1998.

Teubert, W. - Krishnamurthy, R. (eds.): Corpus Linguistics Vol. I-VI. Critical Concepts in Linguistics, Routledge 2007.

Sylabus -

Poslední úprava: Mgr. Lucie Lukešová, Ph.D. (07.02.2014)

Rozpis témat

Následující témata budou při vyučování pokryta. Každý vyučující má individuální přístup k rozvržení hodin (pořadí témat) i v důrazu na jednotlivá témata.

· Co je korpus; korpusy ČNK

· Korpusová lingvistika

· Otázka reprezentativnosti psaných a mluvených korpusů, žánrová rozrůzněnost

· Značkování korpusu - lemmatizace a morfologické značkování; struktura korpusu

· Vyhledání a interpretace konkordance

· Frekvenční analýza (lemmat, slovních tvarů, žánrů, kontextu apod.)

· Pokročilé vyhledávání: CQL a regulární výrazy

· Kolokace, koligace, sémantická prozodie

· Korpusový materiál ve výzkumu jednotlivých jazykových rovin

· Základy zpracování dat (práce s Excelem, vytváření tabulek a grafů)

· Základy statistiky pro práci s korpusem

· Korpusové nástroje SyD, Morfio, KWords

· Specializované korpusy (Diakorp, InterCorp, autorské korpusy)

· Zpracování rozsáhlejšího lingvistického výzkumu (např. bakalářská/diplomová práce) na základě korpusových dat