Cílem tohoto kurzu je seznámit studenty anglistiky se základy korpusového výzkumu. Prostřednictvím praktických úkolů si studenti osvojí dovednosti, které jim umožní korpusy používat ve vlastním lingvistickém výzkumu. Naučí se používat základní funkce korpusových rozhraní, formulovat základní i pokročilé korpusové dotazy, analyzovat data a výsledky své analýzy také popsat a interpretovat.
V průběhu semestru budeme používat různá korpusová rozhraní (KonText, CQPweb a English-Corpora.org), volně dostupné online nástroje pro základní statistickou analýzu (Calc) a software pro analýzu vlastních korpusů (AntConc & Lancsbox). Budeme pracovat s korpusy mluveného i psaného jazyka, stejně jako s korpusy jednojazyčnými, paralelními nebo žákovskými (např. BNC, COCA, COHA, LINDSEI_CZ). Teoretický základ bude poskytnut formou doporučené literatury k samostudiu.
Vzhledem k tomu, že se jedná o praktický kurz, je potřeba, aby si účastníci na každý seminář přinesli vlastní notebook.
Poslední úprava: Bulantová Barbora, Mgr. (21.01.2025)
This course is designed to introduce students of English to the fundamentals of corpus-based and corpus-driven research. Through practical, hands-on tasks, it aims to demonstrate the advantages of using corpora for language analysis and help students develop skills to apply these tools in their own linguistic research. The course covers essential interface functions, query formulation, data analysis, and the interpretation and reporting of results.
Throughout the semester, we will work with a variety of corpus interfaces (KonText, CQPweb and English-Corpora.org), freely available online tools for basic statistical analysis (Calc) and software for analysing self-compiled corpora (AntConc & Lancsbox). We will explore various corpora of spoken and written language, monolingual and parallel, as well as learner corpora (e.g. BNC, COCA, COHA, LINDSEI_CZ). Theoretical background will be provided as supplementary reading for independent study.
As this is a fully hands-on course, participants are expected to bring a laptop to every class.
Poslední úprava: Bulantová Barbora, Mgr. (21.01.2025)
Podmínky zakončení předmětu - angličtina
Activeparticipation in classes (2 absencesmax)
Presentation of corpus-based research at the end of the semester (10 minutes)
Reading materials for self-study in Moodle
Poslední úprava: Bulantová Barbora, Mgr. (21.01.2025)
Literatura - angličtina
Biber, D. & Reppen, R. (2015). The Cambridge Handbook of English Corpus Linguistics. Cambridge University Press.
Brezina, V. (2018). Statistics in corpus linguistics: A practical guide. Cambridge University Press.
Hunston, S. (2002). Corpora in Applied Linguistics. Cambridge University Press.
Lindquist, H. (2009): Corpus Linguistics and the Description of English. Edinburgh University Press.
McEnery, T. and R. Xiao, Y. Tono (2006) Corpus-Based Language Studies. Routledge.
McEnery, T. & Hardie, A. (2012): Corpus linguistics: method, theory and practice. Cambridge University press.
Paquot, M., & Gries, S. T. (Eds.). (2021). A practical handbook of corpus linguistics. Springer Nature.
Poslední úprava: Bulantová Barbora, Mgr. (21.01.2025)
Sylabus - angličtina
Course introduction and basics of KonText (KWIC, basic interface functions, simple queries)
CQL, regular expressions and POS tagging
Collocations & colligations and statistical methods for their identification; n-grams
Introducing BNC corpora, working with sociolinguistic metadata, spoken vs. written corpora
Working with COCA and other corpora on English-corpora.com, British vs. American English
Corpora and contrastive studies: InterCorp parallel corpus & translation equivalents
Introduction to AntConc: frequency lists, n-grams, and self-compiled corpora.
AntConc cont.: analysing learner language, working with reference corpora, keyword lists
Comparing corpora, basic statistical analyses
Presentation of research projects
Poslední úprava: Bulantová Barbora, Mgr. (21.01.2025)