PředmětyPředměty(verze: 962)
Předmět, akademický rok 2024/2025
   Přihlásit přes CAS
Úvod do práce s jazykovými korpusy - AKORPUS01
Anglický název: Introduction to working with language corpora
Zajišťuje: Ústav českého národního korpusu (21-UCNK)
Fakulta: Filozofická fakulta
Platnost: od 2024
Semestr: oba
Body: 3
E-Kredity: 3
Způsob provedení zkoušky:
Počet nekontaktních hodin: 20 [hodiny/semestr]
Rozsah, examinace: 1/1, Z [HS]
Počet míst: zimní:neurčen / 200 (200)
letní:neurčen / neurčen (200)
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Kompetence:  
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: kombinovaný
Způsob výuky: kombinovaný
Úroveň:  
Další informace: https://dl3.cuni.cz/course/view.php?id=447
Poznámka: předmět lze zapsat opakovaně
předmět je možno zapsat mimo plán
povolen pro zápis po webu
student může plnit i v dalších letech
předmět lze zapsat v ZS i LS
Garant: prof. Mgr. Václav Cvrček, Ph.D.
Vyučující: prof. Mgr. Václav Cvrček, Ph.D.
Mgr. Dominika Kováříková, M.A., Ph.D.
Mgr. Michal Křen, Ph.D.
PhDr. Jiří Milička, Ph.D.
Mgr. Michal Škrabal, Ph.D.
Anotace -
 Kurz propojuje teoretické poznatky z korpusové lingvistiky s praktickým nácvikem využívání jazykových korpusů ve filologickém i nefilologickém výzkumu. Po jeho absolvování budou studenti schopni samostatně využívat jazykové korpusy (ČNK i dalších jazyků) pro svůj vlastní výzkum. Seznámí se s běžně užívanými nástroji pro práci s korpusem a základními metodami vyhodnocování výsledků.



Osnova předmětu po jednotlivých týdnech:

Úvod: co je jazykový korpus a jeho využití v empirickém výzkumu jazyka; korpusová lingvistika a její stručná historie

Korpusové nástroje a portály; druhy korpusů; základy práce s korpusovým vyhledávačem KonText

Možnosti práce s konkordancí; absolutní, relativní a redukovaná frekvence; filtrování

Anotace korpusů (lemmatizace, morfologické a syntaktické značkování); specifika anotace korpusů mluveného jazyka, korpusů diachronních a specializovaných (akvizičních, autorských atp.)

Frekvenční distribuce podle pozičních i strukturních atributů a její interpretace; Zipfovy zákony a další statistické vlastnosti textů a korpusů; základní metody statistického vyhodnocování korpusových výsledků

Dotazování pomocí regulárních výrazů

Dotazovací jazyk CQL, kombinace různých atributů při dotazování; sestavování složitějších dotazů s využitím strukturních značek

Reprezentativnost a žánrové složení korpusu; vytváření subkorpusů; jazyková variabilita v korpusu

Korpusový přístup ke gramatice

Využití korpusů v lexikologii/lexikografii; kolokace, koligace a sémantická prozódie; asociační míry

Paralelní korpusy; možnosti kontrastivního korpusového výzkumu; korpusy světových jazyků

Korpusová analýza diskurzu v současné i historické perspektivě (nástroje KWords, SyD)

Prezentace studentského výzkumu s využitím korpusových dat
Poslední úprava: Paštěka Václav, Mgr. (17.08.2023)
Podmínky zakončení předmětu -

ATESTACE
Atestace proběhne formou dvou testů (v polovině a na konci semestru), jejichž
cílem bude ověřit, zda student pochopil základní pojmy korpusové lingvistiky a umí spolehlivě vyhledávat v jazykových
korpusech a nástrojích.

Nutným předpokladem získání atestace je také splnění všech dílčích povinností v rámci e-learningu v Moodlu.

Poslední úprava: Pastyříková Iveta, Mgr. (04.04.2023)
Literatura -

 Povinná literatura:

Baker, P.(2006): Using Corpora in Discourse Analysis. Continuum, London. (úvodní kapitola)

Cvrček, V. – Kováříková, D. (2011): Možnosti a meze korpusové lingvistiky. Naše řeč 94/3, s. 113-133.

McEnery, T. – Hardie, A. (2012): Corpus linguistics: method, theory and practice. Cambridge University Press.

Kurz práce s ČNK. Dostupný z https://wiki.korpus.cz/doku.php/kurz:uvod

Manuál rozhraní KonText. Dostupný z https://wiki.korpus.cz/doku.php/manualy:kontext:index.

 

Doporučená literatura:

Aijmer, K. (ed.) (2009). Corpora and Language Teaching. Amsterdam/Philadeplhia: John Benjamins.

Baayen, H. R. (2008): Analyzing Linguistic Data. Cambridge University Press, Cambridge.

Biber, D. (1993): Representativeness in Corpus Design. Literary and Linguistic Computing Vol. 8, No. 4, s. 243–258.

Biber, D. – Conrad S. – Reppen R. (1998): Corpus Linguistics. Investigating Language Structure and Use. Cambridge University Press, Cambridge.

Biber. D. – Reppen, R. (2015): The Cambridge Handbook of English Corpus Linguistics.Cambridge University Press, Cambridge.

Biber, D. – Conrad, S. (2009): Real Grammar. Pearson Longman. NY.

Sampson, G. – McCarthy, D. (eds) (2004): Corpus Linguistics: Readings in a Widening Perspective. Continuum London.

Cvrček, V. (2013): Kvantitativní analýza kontextu. NLN, Praha.

Cvrček, V. et al. (2010): Mluvnice současné češtiny. Karolinum, Praha.

Cvrček, V. – Čermáková, A. – Křen, M. (2016): Nová koncepce synchronních korpusů psané češtiny. Slovo a slovesnost, 77 (2), (s. 83–101).

Čermák, F. – Blatná, R. (eds) (2006): Korpusová lingvistika: Stav a modelové přístupy. NLN, Praha.

Čermáková, A. (2009): Valence českých substantiv. NLN, Praha. (úvodní kapitola)

Čermáková, A. – Chlumská, L. – Malá, M. (eds) (2016): Jazykové paralely. NLN, Praha.

Evert, S: How Random is a Corpus? The Library Metaphor. Zeitschrift für Anglistik und Amerikanistik 54(2), s. 177-190.

Gries, S. Th. – Wulff, S. – Davies, M. (eds) (2010): Corpus-linguistic Applications, Rodopi.

Gries, S. Th. (2009): Quantitative Corpus Linguistics with R, Routledge.

Hunston, S. (2002): Corpora in Applied Linguistics. Cambridge University Press.

Cheng, W. (2012): Exploring Corpus Linguistics: Language in Action. Routledge.

Chlumská, L. (2014). Není korpus jako korpus. Korpusy v kontrastivní lingvistice a translatologii. In Časopis pro moderní filologii, 96, 2/2014, 221-232.

Jelínek, T. (2008): Nové značkování v Českém národním korpusu. Naše řeč, 91, 1, s. 13–20.

Kováříková, D. (2017): Kvantitativní charakteristiky termínů. NLN, Praha.

Kopřivová, M. – Waclawičová, M. (2008): Čeština v mluveném korpusu. NLN, Praha.  

Kopřivová, M. (2006): Valence českých adjektiv. NLN, Praha.

Křen, M. (2013): Odraz jazykových změn v synchronních korpusech. NLN, Praha.  

Levshina, N. (2015). How to do Linguistics with R. Data exploration and statistical analysis. John Benjamins.

Lindquist, H. (2009): Corpus Linguistics and the Description of English. Edinburgh University Press, Edinburgh.

McEnery, T. – Xiao, R. – Tono, Y. (2006): Corpus-based Language Studies. Routledge, London.

Oakes, M. P. (1998): Statistics for Corpus Linguistics. Edinburgh University Press, Edinburgh.

Osolsobě, K. (2014): Česká morfologie a korpusy. Karolinum, Praha.

Petkevič, V. (2014): Problémy automatické morfologické disambiguace češtiny. Naše řeč, 97, 4, s. 194–207.

Sinclair J. (2003): Reading Concordances. An Introduction. Pearsons Longman London

Sinclair J. (1991): Corpus Concordance Collocation. Oxford, Oxford University Press.

Sinclair, J. (2004): Trust the text. Routledge, London.

Stubbs M. (2001): Words and Phrases. Blackwell, Oxford.

Teubert W., – Čermáková, A. (2007): Corpus Linguistics. A Short Introduction. Continuum London.

Teubert, W. - Krishnamurthy, R. (eds.) (2007): Corpus Linguistics Vol. I-VI, Critical Concepts in Linguistics, Routledge 2007.  

Tognini-Bonelli E. (2004): Corpus Linguistics at Work. John Benjamins, Amsterdam.

 



Poslední úprava: Andrlová Jarmila, Mgr. (22.08.2023)
Metody výuky

FORMA VÝUKY

Seminář je vyučován kombinovanou formou: bloková výuka zahrnuje dvě setkání (úvodní přednášku a procvičovací seminář v polovině semestru) a každotýdenní e-learningové materiály v Moodlu, rozdělené do tematických lekcí. Heslo do kurzu v Moodlu se dozvíte na úvodní přednášce.

Studentům jsou také k dispozici individuální konzultace s pedagogy kurzu (více informací v Moodlu).

 

Poslední úprava: Lukešová Lucie, Mgr., Ph.D. (27.06.2019)
Sylabus

Sylabus předmětu:

1. Využití jazykových korpusů

2. Typy korpusů a korpusových nástrojů

3. Základní pojmy korpusové lingvistiky

4. Hledání v korpusech a regulární výrazy

5. Anotace korpusu

6. Dotazovací jazyky se zaměřením na CQL

7. Pokročilé dotazy (blokový seminář)

Polosemestrální test

8. Kolokace a asociační míry

9. Vícejazyčné korpusy

10. Práce se subkorpusy a vlastními daty

11. Další korpusové zdroje (2 lekce s volitelným obsahem)

11a. Specializovaná lekce (nejen) pro bohemisty o dalších zdrojích pro češtinu

11b. Specializovaná lekce (nejen) pro anglisty o dalších zdrojích pro angličtinu

11c. Specializovaná lekce (nejen) pro translatology věnovaná překladové translatologii

11d. Specializovaná lekce o korpusové lexikologii a lexikografii

11e. Korpusy znakových jazyků

Poslední úprava: Pastyříková Iveta, Mgr. (04.04.2023)
 
Univerzita Karlova | Informační systém UK