SubjectsSubjects(version: 845)
Course, academic year 2018/2019
   Login via CAS
English Diachronic Corpora - AAA500147
Title in English: Anglické diachronní korpusy
Guaranteed by: Department of the English Language and ELT Methodology (21-UAJD)
Faculty: Faculty of Arts
Actual: from 2018
Semester: summer
Points: 0
E-Credits: 5
Examination process: summer s.:
Hours per week, examination: summer s.:0/2 C [hours/week]
Capacity: unknown / 15 (unknown)
Min. number of students: unlimited
State of the course: taught
Language: English
Teaching methods: full-time
Level:  
Additional information: https://dl1.cuni.cz/course/view.php?id=755
Note: course can be enrolled in outside the study plan
enabled for web enrollment
Guarantor: Mgr. Ondřej Tichý, Ph.D.
Teacher(s): Mgr. Ondřej Tichý, Ph.D.
Annotation - Czech
Last update: Mgr. Ondřej Tichý, Ph.D. (03.01.2019)
Předmět je primárně určen magisterským (případně pokročilým výzkumně orientovaným bakalářským) studentům nejen anglické lingvistiky se zájmem o kvantitativní a především korpusové metody v diachronní jazykovědě. <br>
Nabízí přehled anglických diachronních korpusů a vybraných metodologií včetně práce s materiálem, rozhraními a softwarovými nástroji. <br>
Ve spolupráci s ÚČNK představuje i diachronní část Českého národního korpusu. <br>
Předmět je do koncipován jako workshop, po krátkém úvodu si studenti práci s korpusy i představené postupy při řešení konkrétních výzkumných úkolů přímo vyzkouší.<br>
Studentům doporučujeme před zapsáním tohoto kurzu absolvovat kurzy Dějiny anglického jazyka, některý z úvodních kurzů do korpusové lingvistiky případně kurz Data processing, není to však nutné.
Absolventům kurzu doporučujeme rozvinout postupy, s nimiž se zde seznámili, a především výzkumné úkoly, které v kurzu řešili v návazném předmětu Research in English Diachrony.
Course completion requirements - Czech
Last update: Mgr. Ondřej Tichý, Ph.D. (03.01.2019)

Podmínkou atestace je účast (max. 3 absence), aktivní účast na práci v semináři a závěrečný praktický test spočívající v aplikaci osvojených dovedností na konkrétní otázku diachronní korpusové lingvistiky.

Všechny požadavky pro zápočet je nutné splnit do konce zkouškového období akademického roku, ve kterém si student předmět zapsal.

Syllabus
Last update: Mgr. Ondřej Tichý, Ph.D. (03.01.2019)

Methodologies:

  • online interfaces (KonText, Annis, CQP, BYU, Google NGrams, LAEME)
  • POS/Syntactic tagging & Corpus Query Languages
  • regular expressions
  • MS Excel & pivot tables
  • R for Multiple factor analysis, Multidimensional scaling & Principal Components Analysis
  • Visualisation in R, GoogleVis, Gephi

Corpora & Material (specific selection for each run of the seminar is based on students' needs and interests)

  1. Introduction: an overview of corpora, material and methods.
  2. Parsed versions of the Helsinki Corpora (HC, 730-1710)
  3. Corpus of English Dialogues (CED, 1560-1760)
  4. Parsed Corpus of Early English Correspondence (PCEEC, 1400-1800)
  5. Corpus of Historical American English (COHA, 1810-2000)
  6. Google Books/NGrams (1500?-2012)
  7. Early English Books Online (EEBO, 1470s-1810s)
  8. Old Bailey Corpus (OBC, 1720-1913)
  9. Diachronní složka ČNK (DiaKorp, 14.-15. stol.)
  10. Dictionary of Old English Corpus (DOEC, 450?-1100)
  11. A Linguistic Atlas of Early Middle English (LAEME, 1150-1325)
  12. Corpus of Narrative Etymologies and the Corpus of Change

 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html