PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Úvod do práce s jazykovými korpusy - AAA111025
Anglický název: Using Language Corpora: An Introduction
Zajišťuje: Ústav anglického jazyka a didaktiky (21-UAJD)
Fakulta: Filozofická fakulta
Platnost: od 2015
Semestr: zimní
Body: 0
E-Kredity: 4
Způsob provedení zkoušky: zimní s.:
Rozsah, examinace: zimní s.:0/2, Z [HT]
Počet míst: neurčen / neurčen (neurčen)
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Kompetence:  
Stav předmětu: zrušen
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Úroveň:  
Další informace: http://dl1.cuni.cz/course/view.php?id=869
Garant: doc. PhDr. Markéta Malá, Ph.D.
Prerekvizity : AAA230042
Rozvrh   Nástěnka   
Anotace -
Poslední úprava: UAAMALAM (26.01.2011)
Seminář se soustředí zejména na korpusovou lingvistiku jako metodologii. Představuje úvod do využití (a částečně i vytváření) elektronických jazykových korpusů a nástrojů pro práci s nimi. Studenti pracují zejména s Britským Národním korpusem (Xaira, BNCweb). Seznámí se ale i s korpusy jiných regionálních variet angličtiny (COCA - korpus současné americké angličtiny, ICE - Mezinárodní korpus angličtiny) a specializovanými korpusy akademického mluveného jazyka. Synchronní pohled na angličtinu doplní kontrastivní přístup (paralelní korpus angličtiny a češtiny); jeden seminář je věnován korpusovým metodám v diachronním výzkumu. Důraz je kladen na praktické osvojení různých způsobů využití korpusových metod ve studiu anglického jazyka.

Hodnocení kurzu
• aktivní účast na seminářích
• samostatná seminární práce využívající korpusové metody.
Návrhy rámcových témat: porovnání slovníkového hesla s výsledky korpusového dotazu a pokus o modifikaci hesla (kolokace, koligace, sémantická preference); srovnání konkordancí synonym; lexikální a gramatické rozdíly mezi regionálními varietami angličtiny; frekvenční svědectví historického vývoje angličtiny; variace ve struktuře idiomatické fráze (jazyková invence)
Literatura -
Poslední úprava: UAAMALAM (26.01.2011)

Baker, P. (2006) Using Corpora in Discourse Analysis. London / New York: Continuum.

Baker, P. and A. Hardie, T. McEnery (2006) A Glossary of Corpus Linguistics. Edinburgh: Edinburgh University Press.

Biber, D. et al. (1999) Longman Grammar of Spoken and Written English. New York: Longman.

Hoffmann, S et al. (2008) Corpus Linguistics with BNCweb - a Practical Guide. Frankfurt am Main: Peter Lang.

Hunston, S. (2002) Corpora in applied linguistics. Cambridge: Cambridge University Press.

McEnery, T. and R. Xiao, Y. Tono (2006) Corpus-Based Language Studies. London / New York: Routledge.

Meyer, Ch. F. (2002) English Corpus Linguistics: An Introduction. Cambridge: Cambridge University Press.

Teubert, W. and A. Čermáková (2007) Corpus Linguistics. A Short Introduction. London / New York: Continuum.

+ jednotlivé články doporučené v průběhu semináře

Metody výuky -
Poslední úprava: UAAMALAM (29.01.2010)

seminá?

Sylabus
Poslední úprava: UAAMALAM (26.01.2011)

1.      Introduction

Historical outline, corpus-based and corpus-driven approaches, types of corpora

2.      Collocation

First queries with BNC: running the query, KWIC and Sentence view, ordering the results, viewing a larger context and bibliographical information, restricting the query

3.      The simple query

Simple query syntax, words and phrases, variation in phrases, using wildcards, proximity queries

4.      Distribution and sorting

Comparing results, normalized frequencies, statistical significance, dispersion and file-frequency extremes

5.      Collocations

Making statistical claims, association measures

6.      Colligation, pattern grammar

Queries based on part-of-speech and headword/lemma, tagging and parsing

7.      Keywords and frequency lists

Text-type and word lists, using keywords in stylistic analysis

8.      Corpora of spoken language

Problems of transcription, metadata, speakers’ characteristics

9.      Corpora of academic spoken English

Representativeness; units of meaning in spoken corpora, lexical bundles, n-grams

10.  Issues in corpus design

Purpose, size and representativeness, criteria of text selection, sampling, balance, homogeneity, working with self-designed corpora, Antconc, tagging

11.  Corpora in contrastive research

Varieties of English, parallel and comparable corpora

12.  Corpora in diachronic research

Corpus evidence of typological change

13.  Leaving the corpus

Extracting query results to an external database, presenting the results

 
Univerzita Karlova | Informační systém UK