PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Angličtina a korpusy I: Základy práce s jazykovými korpusy - AMLV00048
Anglický název: English and Corpora I: The Basis of the Work with Corpora
Zajišťuje: Ústav českého národního korpusu (21-UCNK)
Fakulta: Filozofická fakulta
Platnost: od 2019
Semestr: oba
Body: 2
E-Kredity: 5
Způsob provedení zkoušky:
Rozsah, examinace: 0/2, Z [HT]
Rozsah za akademický rok: 2 [hodiny]
Počet míst: zimní:neurčen / neurčen (12)
letní:neurčen / neurčen (12)
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Kompetence:  
Stav předmětu: nevyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Úroveň:  
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
předmět lze zapsat v ZS i LS
Garant: Mgr. Lucie Lukešová, Ph.D.
Rozvrh   Nástěnka   
Anotace
Poslední úprava: Mgr. Lucie Lukešová, Ph.D. (09.09.2016)
Cíl semináře

Seminář je určen především pro anglisty, studenty oboru PTA, ale i zájemce z jiných lingvistických oborů, které zajímá kvantitativní pohled na jazyk a využití anglických i českých korpusů při studiu, výzkumu nebo v překladatelské praxi. V průběhu semestru se studenti naučí pracovat s korpusovými manažery KonText (pro korpusy Českého národního korpusu i BNC a pro paralelní korpusy InterCorp) a BNC-Web (pro British National Corpus) a rovněž si vyzkouší práci s webovými rozhraními pro korpusy COCA a COHA. Dále budou v semináři probírána témata, jako je reprezentativnost korpusů a jejich složení, kolokace, vytváření subkorpusů podle zadaných parametrů, využití korpusů v kontrastivní lingvistice a další.

Seminář je vyučován česky, ale hojně využívá anglické terminologie i anglicky psané literatury oboru. Počet studentů v semináři je z kapacitních důvodů omezen na 10.

Na seminář volně navazují semináře Angličtina a korpusy II a III pod záštitou ÚAJD, rovněž je možné pokračovat ve studiu korpusové lingvistiky v dalších seminářích vypisovaných ÚČNK.
Literatura
Poslední úprava: Mgr. Lucie Lukešová, Ph.D. (03.01.2014)

Doporučená literatura:

 

Baayen, H. R.: Analyzing Linguistic Data. Cambridge University Press, Cabridge 2008.

Biber, D. - Conrad, S. - Reppen, R.: Corpus Linguistics: Investigating Language Structure and Use (Cambridge Approaches to Linguistics). Cambridge: Cambridge University Press. 1998.

Biber, D. - Conrad, S. - Leech, G. - Finegan, E. - Johansson, S.: Longman Grammar of Spoken and Written English, Longmann. England 2000.

Biber, D. - Conrad, S.: Real Grammar. Pearson Longman. NY 2009.

Cheng, W.: Exploring Corpus Linguistics: Language in Action. Routledge, 2012.

Čermák F. - Klímová J. - Petkevič V. (eds.): Studie z korpusové lingvistiky. Karolinum, Praha 2000.

Čermák, F. - Blatná, R.: Korpusová lingvistika: Stav a modelové přístupy. NLN, Praha 2006.

Čermák, F. - Šulc, M. (eds.): Kolokace. Nakladatelství Lidové noviny, Praha 2006.

Gries, S. Th. - Wulff, S. - Davies, M. (eds.): Corpus-linguistic applications, Rodopi 2010.

Hunston, S.: Corpora in Applied Linguistics. Cambridge University Press, 2002.

McEnery, T. - Hardie, A.: Corpus linguistics: method, theory and practice. Cambridge University press, 2012.

Oakes, M. P.: Statistics for Corpus Linguistics. Edinburgh University Press, Edinburgh 1998.

Quirk, R. - Greenbaum, S. - Leech, G. - Svartvik, J.: A Grammar of Contemporary English. Longman Group United Kingdom 1972.

Sinclair, J.: Trust the text. Routledge. London. 2004.

Teubert, W. - Krishnamurthy, R. (eds.): Corpus Linguistics Vol. I-VI, Critical Concepts in Linguistics, Routledge 2007.

 

and http://www.korpus.cz, http://bncweb.lancs.ac.uk, http://corpus.byu.edu/

Sylabus
Poslední úprava: Mgr. Lucie Lukešová, Ph.D. (09.09.2016)

Učitel: Mgr. Lucie Chlumská, Ph.D.

 

 

 

lucie.chlumska@ff.cuni.cz, lucie.chlumska@gmail.com

 

 

 

Místnost: S131 na hlavní budově FF UK (vzadu ve dvoře)

 

 

 

 

 

The course consists of 12-13 lessons (2 academic hours).

 

1.    Introduction to the course (syllabus, requirements)

2.    Introduction to corpus linguistics, types of corpora; KonText interface: basic queries, regular expressions (use of wild characters, operators of repetition etc.)

3.    Principles of lemmatisation and morphological tagging of corpora (stochastic methods, rule-based methods of disambiguation); CQL (corpus query language), using lemmas and tags in complex queries

4.    Advanced regular expressions (logical operators); creating subcorpora based on different metadata; concept of representativeness in corpora

5.    Collocations (and colligations) and statistical methods for their identification (incl. word sketches)

6.    InterCorp parallel corpus: searching for translation equivalents, false friends in translation, creating subcorpora on a parallel corpus

7.    Corpora in corpus-based translation studies, translation universals in English and Czech

8.    BNC – about the corpus, BNC-Web interface (querying); English spoken corpora (incl. spoken part of the BNC)

9.    COCA, COHA and other corpora in Mark Davies’ interface (querying); British and American English

10.  N-grams, phrases and corresponding corpus-based tools; academic English

11.  Web corpora; tailor-made corpora and free software to analyse them (AntConc, LancsBox)

12.  AntConc, LancsBox– advanced analysis 

13.  presentation of students' work, discussion

 

 

Rozsah: 0/2 (jednosemestrální kurs otevíraný vždy v zimním semestru)

 

Atestace: Z

 

Kredity: 5

 

 

Požadavky k zápočtu: aktivní účast na seminářích, samostatné zpracování lingvistického jevu (angličtina) korpusovými metodami a jeho prezentace v závěrečné hodině.

 
Univerzita Karlova | Informační systém UK