PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Úvod do práce s jazykovými korpusy - AKORPUS01
Anglický název: Introduction to working with language corpora
Zajišťuje: Ústav českého národního korpusu (21-UCNK)
Fakulta: Filozofická fakulta
Platnost: od 2023 do 2023
Semestr: oba
Body: 3
E-Kredity: 3
Způsob provedení zkoušky:
Počet nekontaktních hodin: 20 [hodiny/semestr]
Rozsah, examinace: 1/1, Z [HS]
Počet míst: zimní:neurčen / 200 (200)
letní:neurčen / neurčen (200)
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Kompetence:  
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: kombinovaný
Způsob výuky: kombinovaný
Úroveň:  
Vysvětlení: v rámci Moodlu hledejte kurz pro aktuální semestr podle kódu předmětu AKORPUS01
Další informace: https://dl3.cuni.cz/course/
Poznámka: předmět lze zapsat opakovaně
předmět je možno zapsat mimo plán
povolen pro zápis po webu
student může plnit i v dalších letech
předmět lze zapsat v ZS i LS
Garant: prof. Mgr. Václav Cvrček, Ph.D.
Mgr. Michal Škrabal, Ph.D.
Mgr. Dominika Kováříková, M.A., Ph.D.
Vyučující: prof. Mgr. Václav Cvrček, Ph.D.
Mgr. Dominika Kováříková, M.A., Ph.D.
Mgr. Michal Křen, Ph.D.
PhDr. Jiří Milička, Ph.D.
Mgr. Michal Škrabal, Ph.D.
Anotace -
Poslední úprava: Mgr. Václav Paštěka (17.08.2023)
Úvodní seminář pro všechny zájemce o práci s jazykovými korpusy.

CÍL SEMINÁŘE
Cílem semináře je poskytnout základní orientaci v tématech korpusové lingvistiky, vysvětlit principy výstavby a anotace různých typů jazykových korpusů a představit dostupné korpusové vyhledavače a nástroje, vč. základního i pokročilého vyhledávání.

Podmínky zakončení předmětu -
Poslední úprava: Mgr. Iveta Pastyříková (04.04.2023)

ATESTACE
Atestace proběhne formou dvou testů (v polovině a na konci semestru), jejichž
cílem bude ověřit, zda student pochopil základní pojmy korpusové lingvistiky a umí spolehlivě vyhledávat v jazykových
korpusech a nástrojích.

Nutným předpokladem získání atestace je také splnění všech dílčích povinností v rámci e-learningu v Moodlu.

Literatura -
Poslední úprava: Mgr. Václav Paštěka (17.08.2023)

Povinná literatura:
Baker, P.(2006): Using Corpora in Discourse Analysis. Continuum, London. (úvodní kapitola)

Cvrček, V. - Kováříková, D. (2011): Možnosti a meze korpusové lingvistiky. Naše řeč 94/3, s. 113-133.

McEnery, T. - Hardie, A. (2012): Corpus linguistics: method, theory and practice. Cambridge University Press.

McEnery, T., - Brezina, V. (2022). Fundamental Principles of Corpus Linguistics. Cambridge: Cambridge

University Press.

Kurz práce s ČNK. Dostupný z https://wiki.korpus.cz/doku.php/kurz:uvod

Manuál rozhraní KonText. Dostupný z https://wiki.korpus.cz/doku.php/manualy:kontext:index

Doporučená literatura
Aijmer, K. (ed.) (2009). Corpora and Language Teaching. Amsterdam/Philadeplhia: John Benjamins.

Biber, D. (1993): Representativeness in Corpus Design. Literary and Linguistic Computing Vol. 8, No. 4, s.

243-258.

Biber, D. - Conrad S. - Reppen R. (1998): Corpus Linguistics. Investigating Language Structure and Use.

Cambridge University Press, Cambridge.

Biber. D. - Reppen, R. (2015): The Cambridge Handbook of English Corpus Linguistics.Cambridge University

Press, Cambridge.

Sampson, G. - McCarthy, D. (eds) (2004): Corpus Linguistics: Readings in a Widening Perspective.

Continuum London.

Cvrček, V. (2013): Kvantitativní analýza kontextu. NLN, Praha.

Cvrček, V. et al. (2010): Mluvnice současné češtiny. Karolinum, Praha.

Cvrček, V. - Čermáková, A. - Křen, M. (2016): Nová koncepce synchronních korpusů psané češtiny. Slovo a

slovesnost, 77 (2), (s. 83-101).

Čermák, F. - Blatná, R. (eds) (2006): Korpusová lingvistika: Stav a modelové přístupy. NLN, Praha.

Čermáková, A. (2009): Valence českých substantiv. NLN, Praha. (úvodní kapitola).

Čermáková, A. - Chlumská, L. - Malá, M. (eds) (2016): Jazykové paralely. NLN, Praha.

Evert, S: How Random is a Corpus? The Library Metaphor. Zeitschrift für Anglistik und Amerikanistik 54(2), s.

177-190.

Gries, S. Th. - Wulff, S. - Davies, M. (eds) (2010): Corpus-linguistic Applications, Rodopi.

Gries, S. Th. (2009): Quantitative Corpus Linguistics with R, Routledge.

Hunston, S. (2002): Corpora in Applied Linguistics. Cambridge University Press.

Cheng, W. (2012): Exploring Corpus Linguistics: Language in Action. Routledge.

Chlumská, L. (2014). Není korpus jako korpus. Korpusy v kontrastivní lingvistice a translatologii. In Časopis

pro moderní filologii, 96, 2/2014, 221-232.

Jelínek, T. (2008): Nové značkování v Českém národním korpusu. Naše řeč, 91, 1, s. 13-20.

Kováříková, D. (2017): Kvantitativní charakteristiky termínů. NLN, Praha.

Kopřivová, M. - Waclawičová, M. (2008): Čeština v mluveném korpusu. NLN, Praha.

Křen, M. (2013): Odraz jazykových změn v synchronních korpusech. NLN, Praha.

Levshina, N. (2015). How to do Linguistics with R. Data exploration and statistical analysis. John Benjamins.

Lindquist, H. (2009): Corpus Linguistics and the Description of English. Edinburgh University Press,

Edinburgh.

McEnery, T. - Xiao, R. - Tono, Y. (2006): Corpus-based Language Studies. Routledge, London.

Oakes, M. P. (1998): Statistics for Corpus Linguistics. Edinburgh University Press, Edinburgh.

Osolsobě, K. (2014): Česká morfologie a korpusy. Karolinum, Praha.

Petkevič, V. (2014): Problémy automatické morfologické disambiguace češtiny. Naše řeč, 97, 4, s. 194-207.

Sinclair J. (2003): Reading Concordances. An Introduction. Pearsons Longman London.

Sinclair, J. (2004): Trust the text. Routledge, London.

Teubert W., - Čermáková, A. (2007): Corpus Linguistics. A Short Introduction. Continuum London.

Teubert, W. - Krishnamurthy, R. (eds.) (2007): Corpus Linguistics Vol. I-VI, Critical Concepts in Linguistics,

Routledge 2007.

Tognini-Bonelli E. (2004): Corpus Linguistics at Work. John Benjamins, Amsterdam.

Metody výuky
Poslední úprava: Mgr. Lucie Lukešová, Ph.D. (27.06.2019)

FORMA VÝUKY

Seminář je vyučován kombinovanou formou: bloková výuka zahrnuje dvě setkání (úvodní přednášku a procvičovací seminář v polovině semestru) a každotýdenní e-learningové materiály v Moodlu, rozdělené do tematických lekcí. Heslo do kurzu v Moodlu se dozvíte na úvodní přednášce.

Studentům jsou také k dispozici individuální konzultace s pedagogy kurzu (více informací v Moodlu).

 

Sylabus
Poslední úprava: Mgr. Iveta Pastyříková (04.04.2023)

Sylabus předmětu:

1. Využití jazykových korpusů

2. Typy korpusů a korpusových nástrojů

3. Základní pojmy korpusové lingvistiky

4. Hledání v korpusech a regulární výrazy

5. Anotace korpusu

6. Dotazovací jazyky se zaměřením na CQL

7. Pokročilé dotazy (blokový seminář)

Polosemestrální test

8. Kolokace a asociační míry

9. Vícejazyčné korpusy

10. Práce se subkorpusy a vlastními daty

11. Další korpusové zdroje (2 lekce s volitelným obsahem)

11a. Specializovaná lekce (nejen) pro bohemisty o dalších zdrojích pro češtinu

11b. Specializovaná lekce (nejen) pro anglisty o dalších zdrojích pro angličtinu

11c. Specializovaná lekce (nejen) pro translatology věnovaná překladové translatologii

11d. Specializovaná lekce o korpusové lexikologii a lexikografii

11e. Korpusy znakových jazyků

 
Univerzita Karlova | Informační systém UK