Předměty

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

Angličtina a korpusy I: Základy práce s jazykovými korpusy - AAA500120

Anglický název:	English Language and Corpus Linguistics I: Corpora, tools and statistics
Zajišťuje:	Ústav anglického jazyka a didaktiky (21-UAJD)
Fakulta:	Filozofická fakulta
Platnost:	od 2018
Semestr:	zimní
Body:	0
E-Kredity:	5
Způsob provedení zkoušky:	zimní s.:
Rozsah, examinace:	zimní s.:0/2, Z [HT]
Počet míst:	neurčen / neurčen (neurčen)
Minimální obsazenost:	neomezen
4EU+:	ne
Virtuální mobilita / počet míst pro virtuální mobilitu:	ne
Kompetence:
Stav předmětu:	nevyučován
Jazyk výuky:	čeština
Způsob výuky:	prezenční
Způsob výuky:	prezenční
Úroveň:
Další informace:	https://dl1.cuni.cz/course/view.php?id=868
Poznámka:	předmět je možno zapsat mimo plán povolen pro zápis po webu

Garant:	Mgr. Lucie Lukešová, Ph.D.
Záměnnost :	AMLV00056
Je prerekvizitou pro:	AAA5PP120

Rozvrh Nástěnka

Anotace -

Poslední úprava: Mgr. Lucie Lukešová, Ph.D. (09.10.2018)

Cíl semináře
Seminář je určen především pro anglisty, studenty oboru PTA, ale i zájemce z jiných lingvistických oborů, které zajímá kvantitativní pohled na jazyk a využití anglických i českých korpusů při studiu, výzkumu nebo v překladatelské praxi. V průběhu semestru se studenti naučí pracovat s korpusovými manažery KonText (dříve NoSketch Engine) (pro korpusy Českého národního korpusu i BNC a pro paralelní korpusy InterCorp) a BNC-Web (pro British National Corpus) a rovněž si vyzkouší práci s webovými rozhraními pro korpusy COCA a COHA. Dále budou v semináři probírána témata, jako je reprezentativnost korpusů a jejich složení, kolokace, vytváření subkorpusů podle zadaných parametrů, využití korpusů v kontrastivní lingvistice a další. Seminář je vyučován česky, ale hojně využívá anglické terminologie i anglicky psané literatury oboru. Počet studentů v semináři je z kapacitních důvodů omezen na 10. Na seminář volně navazují semináře Angličtina a korpusy II a III pod záštitou ÚAJD, rovněž je možné pokračovat ve studiu korpusové lingvistiky v dalších seminářích vypisovaných ÚČNK.

Podmínky zakončení předmětu

Poslední úprava: Mgr. Zuzana Freitas Lopesová (06.11.2017)

Požadavky k zápočtu: aktivní účast na seminářích, samostatné zpracování lingvistického jevu (angličtina) korpusovými metodami a jeho prezentace v závěrečné hodině.

Všechny požadavky pro zápočet je nutné splnit do konce zkouškového období akademického roku, ve kterém si student předmět zapsal.

Literatura -

Poslední úprava: Mgr. Lucie Lukešová, Ph.D. (07.10.2013)

Doporučená literatura:

Baayen, H. R.: Analyzing Linguistic Data. Cambridge University Press, Cabridge 2008.

Biber, D. - Conrad, S. - Reppen, R.: Corpus Linguistics: Investigating Language Structure and Use (Cambridge Approaches to Linguistics). Cambridge: Cambridge University Press. 1998.

Biber, D. - Conrad, S. - Leech, G. - Finegan, E. - Johansson, S.: Longman Grammar of Spoken and Written English, Longmann. England 2000.

Biber, D. - Conrad, S.: Real Grammar. Pearson Longman. NY 2009.

Cheng, W.: Exploring Corpus Linguistics: Language in Action. Routledge, 2012.

Čermák F. - Klímová J. - Petkevič V. (eds.): Studie z korpusové lingvistiky. Karolinum, Praha 2000.

Čermák, F. - Blatná, R.: Korpusová lingvistika: Stav a modelové přístupy. NLN, Praha 2006.

Čermák, F. - Šulc, M. (eds.): Kolokace. Nakladatelství Lidové noviny, Praha 2006.

Gries, S. Th. - Wulff, S. - Davies, M. (eds.): Corpus-linguistic applications, Rodopi 2010.

Hunston, S.: Corpora in Applied Linguistics. Cambridge University Press, 2002.

McEnery, T. – Hardie, A.: Corpus linguistics: method, theory and practice. Cambridge University press, 2012.

Oakes, M. P.: Statistics for Corpus Linguistics. Edinburgh University Press, Edinburgh 1998.

Quirk, R. - Greenbaum, S. - Leech, G. - Svartvik, J.: A Grammar of Contemporary English. Longman Group United Kingdom 1972.

Sinclair, J.: Trust the text. Routledge. London. 2004.

Teubert, W. - Krishnamurthy, R. (eds.): Corpus Linguistics Vol. I-VI, Critical Concepts in Linguistics, Routledge 2007.

and http://www.korpus.cz, http://bncweb.lancs.ac.uk, http://corpus.byu.edu/

Sylabus -

Poslední úprava: Mgr. Lucie Lukešová, Ph.D. (03.01.2014)

Učitel: Mgr. Lucie Chlumská
lucie.chlumska@ff.cuni.cz, lucie.chlumska@gmail.com
Místnost: S131 na hlavní budově FF UK (vzadu ve dvoře)

The course consists of 12-13 lessons (2 academic hours).
1. introduction to the course, registration to the corpora (CNC, BNC, COCA)
2. introduction to corpus linguistics, types of corpora, basic queries, regular expressions (use of wild characters, operators of repetition etc.), KonText interface
3. principles of lemmatisation and morphological tagging of corpora (stochastic methods, rule-based methods of disambiguation), CQL (corpus query language), using lemmas and tags in complex queries
4. advanced regular expressions (logical operators), filters - positive and negative, creating subcorpora based on different metadata, concept of representativeness in corpora of spoken and written language
5. the InterCorp parallel corpus, searching for translation equivalents, false friends in translation, creating subcorpora on a parallel corpus
6. collocations and statistical methods for their identification
7. corpora in translation studies, translation universals in English
8. BNC - about the corpus, BNC Web interface
9. English spoken corpora (incl. spoken part of the BNC), corpus-based vs. corpus-driven approach
10. COCA, COHA and other corpora in Mark Davies’ interface, querying
11. British and American English - case studies
12. other English corpora and interfaces, building a corpus, AntConc (clusters, keywords)
13. presentation of students' work, discussion

Rozsah: 0/2 (jednosemestrální kurs otevíraný vždy v zimním semestru)
Atestace: Z
Kredity: Kredity: 5
Požadavky k zápočtu: aktivní účast na seminářích, samostatné zpracování lingvistického jevu (angličtina) korpusovými metodami a jeho prezentace v závěrečné hodině