Anglické diachronní korpusy - AAA500147
Anglický název: English Diachronic Corpora
Zajišťuje: Ústav anglického jazyka a didaktiky (21-UAJD)
Fakulta: Filozofická fakulta
Platnost: od 2018
Semestr: letní
Body: 0
E-Kredity: 5
Způsob provedení zkoušky: letní s.:
Rozsah, examinace: letní s.:0/2 Z [hodiny/týden]
Počet míst: neurčen / 15 (neurčen)
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: angličtina
Způsob výuky: prezenční
Úroveň:  
Další informace: https://dl1.cuni.cz/course/view.php?id=755
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
Garant: Mgr. Ondřej Tichý, Ph.D.
Vyučující: Mgr. Ondřej Tichý, Ph.D.
Rozvrh   Nástěnka   
Anotace
Poslední úprava: Mgr. Ondřej Tichý, Ph.D. (03.01.2019)
Předmět je primárně určen magisterským (případně pokročilým výzkumně orientovaným bakalářským) studentům nejen anglické lingvistiky se zájmem o kvantitativní a především korpusové metody v diachronní jazykovědě. <br>
Nabízí přehled anglických diachronních korpusů a vybraných metodologií včetně práce s materiálem, rozhraními a softwarovými nástroji. <br>
Ve spolupráci s ÚČNK představuje i diachronní část Českého národního korpusu. <br>
Předmět je do koncipován jako workshop, po krátkém úvodu si studenti práci s korpusy i představené postupy při řešení konkrétních výzkumných úkolů přímo vyzkouší.<br>
Studentům doporučujeme před zapsáním tohoto kurzu absolvovat kurzy Dějiny anglického jazyka, některý z úvodních kurzů do korpusové lingvistiky případně kurz Data processing, není to však nutné.
Absolventům kurzu doporučujeme rozvinout postupy, s nimiž se zde seznámili, a především výzkumné úkoly, které v kurzu řešili v návazném předmětu Research in English Diachrony.
Podmínky zakončení předmětu
Poslední úprava: Mgr. Ondřej Tichý, Ph.D. (03.01.2019)

Podmínkou atestace je účast (max. 3 absence), aktivní účast na práci v semináři a závěrečný praktický test spočívající v aplikaci osvojených dovedností na konkrétní otázku diachronní korpusové lingvistiky.

Všechny požadavky pro zápočet je nutné splnit do konce zkouškového období akademického roku, ve kterém si student předmět zapsal.

Sylabus - angličtina
Poslední úprava: Mgr. Ondřej Tichý, Ph.D. (03.01.2019)

Methodologies:

  • online interfaces (KonText, Annis, CQP, BYU, Google NGrams, LAEME)
  • POS/Syntactic tagging & Corpus Query Languages
  • regular expressions
  • MS Excel & pivot tables
  • R for Multiple factor analysis, Multidimensional scaling & Principal Components Analysis
  • Visualisation in R, GoogleVis, Gephi

Corpora & Material (specific selection for each run of the seminar is based on students' needs and interests)

  1. Introduction: an overview of corpora, material and methods.
  2. Parsed versions of the Helsinki Corpora (HC, 730-1710)
  3. Corpus of English Dialogues (CED, 1560-1760)
  4. Parsed Corpus of Early English Correspondence (PCEEC, 1400-1800)
  5. Corpus of Historical American English (COHA, 1810-2000)
  6. Google Books/NGrams (1500?-2012)
  7. Early English Books Online (EEBO, 1470s-1810s)
  8. Old Bailey Corpus (OBC, 1720-1913)
  9. Diachronní složka ČNK (DiaKorp, 14.-15. stol.)
  10. Dictionary of Old English Corpus (DOEC, 450?-1100)
  11. A Linguistic Atlas of Early Middle English (LAEME, 1150-1325)
  12. Corpus of Narrative Etymologies and the Corpus of Change