Poslední úprava: Mgr. Lucie Lukešová, Ph.D. (07.02.2014)
Seminář je určen bohemistům a dalším zájemcům o práci s jazykovým korpusem. Po absolvování semináře budou studenti schopni samostatně využívat korpusy psané a mluvené češtiny pro svou vlastní lingvistickou práci. Naučí se pracovat s korpusovým manažerem KonText a dalšími nástroji pro práci s korpusem, seznámí se s jazykovým materiálem v korpusech ČNK (především se synchronními psanými a mluvenými korpusy). V rámci samostatného výzkumu dokážou vyhledat a interpretovat lingvistický jev.
Počet studentů v semináři je z kapacitních důvodů omezen na 10.
Požadavky k zápočtu: aktivní účast na seminářích, test, samostatné zpracování lingvistického jevu korpusovými metodami.
Poslední úprava: Mgr. Michal Křen, Ph.D. (28.05.2018)
The course is aimed typically at the students of Czech studies. The students will get to know the language corpora available at Czech National Corpus and learn how to use them for their own research. They will also learn how to work with the KonText query interface and other web applications to query, find and interpret language phenomena.
Credit requirements: active participation, test, analysis of a language phenomenon using corpus linguistic methods.
Literatura -
Poslední úprava: Mgr. Lucie Lukešová, Ph.D. (07.02.2014)
Povinná literatura
Baker, P.: Using Corpora in Discourse Analysis. Continuum, London 2006. (úvodní kapitola)
Čermáková, A.: Valence českých substantiv. Studie z korpusové lingvistiky, svazek 9. NLN, Praha 2009. (úvodní kapitola)
Cvrček, V. - Kováříková, D.: Možnosti a meze korpusové lingvistiky. Naše řeč 94/3, 2011 (s. 113-133).
Doporučená literatura
Bartoň, T. a kol.: Statistiky češtiny. NLN, Praha 2009.
Cvrček, V. a kol..: Mluvnice současné češtiny /Grammar of Contemporary Czech/. Karolinum. Praha 2010, (353 s.).
Biber, D. et al.: Corpus Linguistics: Investigating Language Structure and Use. Cambridge University Press, Cambridge 1998.
Oakes, M. P.: Statistics for Corpus Linguistics. Edinburg University Press, Edinburg 1998.
Teubert, W. - Krishnamurthy, R. (eds.): Corpus Linguistics Vol. I-VI. Critical Concepts in Linguistics, Routledge 2007.
Poslední úprava: Mgr. Michal Křen, Ph.D. (28.05.2018)
Compulsory reading
Baker, P.: Using Corpora in Discourse Analysis. Continuum, London 2006. (initial chapter)
Čermáková, A.: Valence českých substantiv. Studie z korpusové lingvistiky, volume 9. NLN, Praha 2009. (initial chapter)
Cvrček, V. - Kováříková, D.: Možnosti a meze korpusové lingvistiky. Naše řeč 94/3, 2011 (p. 113-133).
Recommended reading
Bartoň, T. a kol.: Statistiky češtiny. NLN, Praha 2009.
Cvrček, V. a kol..: Mluvnice současné češtiny /Grammar of Contemporary Czech/. Karolinum. Praha 2010 (353 pages).
Biber, D. et al.: Corpus Linguistics: Investigating Language Structure and Use. Cambridge University Press, Cambridge 1998.
Oakes, M. P.: Statistics for Corpus Linguistics. Edinburg University Press, Edinburg 1998.
Teubert, W. - Krishnamurthy, R. (eds.): Corpus Linguistics Vol. I-VI. Critical Concepts in Linguistics, Routledge 2007.
Sylabus -
Poslední úprava: Mgr. Lucie Lukešová, Ph.D. (07.02.2014)
Rozpis témat
Následující témata budou při vyučování pokryta. Každý vyučující má individuální přístup k rozvržení hodin (pořadí témat) i v důrazu na jednotlivá témata.
· Co je korpus; korpusy ČNK
· Korpusová lingvistika
· Otázka reprezentativnosti psaných a mluvených korpusů, žánrová rozrůzněnost
· Značkování korpusu - lemmatizace a morfologické značkování; struktura korpusu
· Zpracování rozsáhlejšího lingvistického výzkumu (např. bakalářská/diplomová práce) na základě korpusových dat
Poslední úprava: Mgr. Michal Křen, Ph.D. (28.05.2018)
Topics
The course covers the following topics. Each lecturer has his/her own individual approach, the order of and/or emphasis on the particular topic can thus vary.
What is a corpus; CNC corpora
Corpus linguistics
Reprezentativeness of written and spoken corpora, register variation
Corpus annotation and structure
Corpus querying and interpretation of a concordance
Frequency analysis
Regular expressions and advanced CQL queries
Collocation, colligation and semantic prosody
Corpus material in the research of individual language layers
Basic foundations of data processing (MS Excel, tables and figures)