Poslední úprava: PhDr. Olga Nádvorníková, Ph.D. (05.02.2016)
Kurz je teoretickým a praktickým úvodem do korpusové lingvistiky, která představuje jeden z dominantních proudů současné lingvistiky. Cílem předmětu je poskytnout studentům italianistiky, hispanistiky, portugalistiky a francouzské filologie základy k vlastní práci s korpusy, tj. s rozsáhlými počítačově zpracovanými soubory textů, tak aby byli schopni je využít jak v běžné praxi, tak pro přípravu bakalářských nebo diplomových prací.
Podmínky zakončení předmětu
Poslední úprava: PhDr. Olga Nádvorníková, Ph.D. (24.08.2023)
Požadavky ke kontrole studia:
aktivní účast v kurzu
vypracování a prezentace individuálního korpusového výzkumu (10 min.)
Podmínkou zápisu do kurzu je znalost alespoň jednoho románského jazyka; znalost angličtiny je výhodou, nikoli podmínkou. Předchozí zkušenost s korpusy není nutná. Kurz je veden v češtině.
Pro vykonání atestace z tohoto předmětu mají studenti právo na jeden řádný a dva opravné termíny.
Literatura
Poslední úprava: doc. Mgr. Pavel Štichauer, Ph.D. (15.05.2018)
Baker, P. (2010). Sociolinguistics and corpus linguistics. Edinburgh: Edinburgh University Press 2010.
Ballard, M. (2007). Les Corpus en linguistique et en traductologie. Arras: Artois Presses Université 2007.
Cvrček, V. - Kováříková, D. (2011). "Možnosti a meze korpusové lingvistiky". Naše řeč 94/3, 2011, s. 113-133.
Čermák, F. (ed.) (2011). Korpusová lingvistika Praha 2011. 1. InterCorp. Praha: NLN 2011.
Čermák, F. - Blatná, R. et al. (2005). Jak využívat Český národní korpus. Studijní příručka. Praha: NLN 2005.
Čermák, F. - Kocek, J. (eds) (2010). Mnohojazyčný korpus InterCorp: Možnosti studia. Praha: NLN/Ústav Českého národního korpusu 2010.
Čermák, P. - Štichauer, P. (2010). "Španělské a italské kauzativní konstrukce hacer / fare + sloveso a jejich české ekvivalenty". In Čermák, F. - Kocek, J. (et alii). 1. vyd. Mnohojazyčný korpus Intercorp: Možnosti studia. Praha: NLN/ÚČNK 2010, s. 70-91.
Čermáková, A. - Fárová, L.: "Keywords in Harry Potter and their Czech and Finnish translation equivalents". In Čermák, Fr. - Corness, P. - Klégr, A.: InterCorp: Exploring a Multilingual Corpus. Praha: NLN - ÚČNK 2010, s. 177-189.
Granger, S. - Lerot, J. - Petch-Tyson, S. (eds). (2003). Corpus‑based Approaches to Contrastive Linguistics and Translations Studies. Amsterdam - Atlanta: Rodopi 2003.
Hajičová, E. - Petkevič. V. - Čermák, Fr - Blatná, R. (2006). Korpusová lingvistika: Stav a modelové přístupy. Praha: NLN 2006.
Chiari, I. (2007) Introduzione alla linguistica computazionale. Bari: Laterza 2007.
Kocek, J. - Kopřivová, M. - Kučera, K. (eds.) (2010). Český národní korpus - úvod a příručka uživatele. Praha. ÚČNK FF UK 2000.
Lenci, A. et al. (2005). Testo e computer. Elementi di linguistica computazionale, Roma: Carocci 2005.
McEnery, T. - Wilson, A. (2001). Corpus linguistics: an introduction. 2nd ed. Edinburgh: Edinburgh University Press 2001.
Nádvorníková, O. (2007). "Existuje pro francouzštinu ekvivalent ČNK?" In Štícha, Fr. - Šimandl, J. (eds). Grammar and Corpora. Praha: Ústav pro jazyk český AV ČR, 2007, s. 179-190.
Nádvorníková, O. (2010). "The French gérondif and its Czech equivalents",In Čermák, Fr. - Corness, P. - Klégr, A. (eds). InterCorp: Exploring a Multilingual Corpus. Praha: NLN/Ústav Českého národního korpusu, 2010, s. 83-96.
Oakes, M. P. (1998). Statistics for Corpus Linguistics. Edinburgh: Edinburgh University Press 1998.
Olohan, M. (2004). Introducing Corpora in Translation Studies. London - New York: Routledge 2004.
Parodi, G. (ed.) (2007). Working With Spanish Corpora. London: Continuum 2007.
Parodi, Giovanni. Linguistica de corpus: de la teoria a la empiria. Madrid: Iberoamericana 2010.
Šulc, M. (1999). Korpusová lingvistika: první vstup. Praha: Karolinum 1999.
Williams, Geoffrey (ed.) (2005). La linguistique de corpus. Rennes: Presses universitaires de Rennes 2005.
Metody výuky
Poslední úprava: PhDr. Olga Nádvorníková, Ph.D. (29.01.2023)
Kurz kombinuje teoretický výklad s praktickou aplikací - vyhledáváním v korpusech. Je proto vhodné mít k dispozici vlastní počítač, příp. tablet.
Ke kurzu je k dispozici kurz v Moodle.
Sylabus
Poslední úprava: PhDr. Olga Nádvorníková, Ph.D. (05.09.2013)
Obsah kurzu:
1. Definice korpusu, typologie, reprezentativnost, možnosti a metodologická omezení.
2.-3. Základní a pokročilé vyhledávání v korpusech - na příkladu paralelního korpusu InterCorp; principy kontrastivního korpusového výzkumu.
4.-5. Významné korpusy jednotlivých románských jazyků a možnosti jejich využití.
6.-7. Základy statistického zpracování korpusových dat (typy frekvence, frekvenční seznamy, MI-score, T-score atd.); víceslovná spojení a kolokace v korpusu.
8. Korpusy mluveného jazyka.
9. Základní postupy stylometrie (textometrie), analýza klíčových slov v textech (keywords), textové vzorce (textual patterns).
10.-11. Praktické korpusové sondy morfologické, syntaktické, lexikálně-sémantické, pragmatické i sociolingvistické (např. morfologická produktivita v korpusu, příznakový slovosled, prostředky vyjádření epistemické modality v románských jazycích a jejich české protějšky, diskurzivní částice, derivovaná adjektiva, činitelská jména nebo kauzativní konstrukce a jejich české protějšky, výzkum jazykových variet, např. evropské a americké španělštiny/portugalštiny aj.).
12. Prezentace studentských korpusových výzkumů a jejich hodnocení.
Vstupní požadavky
Poslední úprava: PhDr. Olga Nádvorníková, Ph.D. (05.09.2013)
Podmínkou zápisu do kurzu je znalost alespoň jednoho románského jazyka; znalost angličtiny je výhodou, nikoli podmínkou. Předchozí zkušenost s korpusy není nutná. Kurz je veden v češtině.
Požadavky k zápisu
Poslední úprava: PhDr. Olga Nádvorníková, Ph.D. (05.09.2013)
Podmínkou zápisu do kurzu je znalost alespoň jednoho románského jazyka; znalost angličtiny je výhodou, nikoli podmínkou. Předchozí zkušenost s korpusy není nutná. Kurz je veden v češtině.