SubjectsSubjects(version: 945)
Course, academic year 2023/2024
   Login via CAS
Corpora of Slavic Languages - AMLV00071
Title: Korpusy slovanských jazyků
Guaranteed by: Institute of Czech and Deaf Studies (21-UBN)
Faculty: Faculty of Arts
Actual: from 2023
Semester: both
Points: 0
E-Credits: 4
Examination process:
Hours per week, examination: 0/2, C [HT]
Capacity: winter:unknown / 10 (10)
summer:unknown / unknown (10)
Min. number of students: unlimited
4EU+: no
Virtual mobility / capacity: no
Key competences:  
State of the course: not taught
Language: Czech
Teaching methods: full-time
Teaching methods: full-time
Level:  
Note: course can be enrolled in outside the study plan
enabled for web enrollment
you can enroll for the course in winter and in summer semester
Guarantor: Mgr. Adrian Jan Zasina, Ph.D.
Teacher(s): Mgr. Adrian Jan Zasina, Ph.D.
Schedule   Noticeboard   
Annotation -
Last update: Mgr. Adrian Jan Zasina, Ph.D. (14.09.2023)
The seminar is intended for students of Slavic languages and students of philological disciplines with an interest in Slavic languages and their investigation by means of corpora. No previous experience with corpora is expected. During the course, students will acquire basic information about corpus linguistics, national corpora of Slavic languages and their application in practice. The seminar will primarily focus on the characteristics of the Czech, Slovak, Polish and Russian national corpus, as well as corpus resources of other Slavic languages according to students’ interest. We will also practise working with each of the corpora we will cover. Furthermore, we will explore Slavic resources within parallel corpora in the context of comparing Slavic languages; firstly, we will familiarise ourselves with different approaches to the morphological description of particular languages (different tagsets), and secondly, we will focus on the use of corpus material in comparative linguistics.
Aim of the course - Czech
Last update: Mgr. Adrian Jan Zasina, Ph.D. (14.09.2023)

Cílem předmětu je poskytnout účastníkům základní informace o korpusech slovanských jayzků a naučit je pracovat s korpusovými daty v rámci různých slovanských korpusů, obzvlášť v rámci paraleního korpusu InterCorp.

Course completion requirements -
Last update: Mgr. Adrian Jan Zasina, Ph.D. (25.09.2023)

Course completion requirements:

 

·       oral presentation of a research project,

·       completing homework assignments,

·       final term paper (10,000 characters including spaces)

Literature -
Last update: Mgr. Adrian Jan Zasina, Ph.D. (22.09.2020)

Basic:

Bańko, M., & Górski, R. L. (2014). Praktyczny przewodnik po korpusie języka polskiego. In M. Hebal-Jezierska (Ed.), Praktyczny przewodnik po korpusach języków słowiańskich (pp. 11–28). Warszawa: Wydział Polonistyki Uniwersytetu Warszawskiego.

Čermák, F., & Schmiedtová, V. (2004). Český národní korpus – základní charakteristika a širší souvislosti. Národní knihovna3, 152–168.

Chlumská, L. (2014). Není korpus jako korpus: Korpusy v kontrastivní lingvistice a translatologii. Časopis pro moderní filologii96(2), 221–232.

Šimková, M. (2006). Slovak National Corpus – history and current situation. In M. Šimková (Ed.), Insight into the Slovak and Czech corpus linguistics (pp. 151–159). Bratislava: Veda.

Сичинава Д. В. (2005). Национальный корпус русского языка: очерк предыстории. In Национальный корпус русского языка: 2003—2005 (pp. 21–30). Москва: Индрик.

 

Recommended:

Hebal-Jezierska, M. (Ed.). (2014). Praktyczny przewodnik po korpusach języków słowiańskich. Warszawa: Wydział Polonistyki Uniwersytetu Warszawskiego.

Martinková, M. (2014). K metodologii využití paralelních korpusů v kontrastivní lingvistice. Naše řeč97(4–5), 270–285.

Syllabus - Czech
Last update: Mgr. Adrian Jan Zasina, Ph.D. (13.02.2023)
  1. Úvod – korpusová lingvistika, k čemu korpusy využívat 

  2. Český národní korpus 

  3. Slovenský národní korpus 

  4. Národní korpus polského jazyka 

  5. Národní korpus ruského jazyka 

  6. Korpusy ostatních slovanských jazyků (studentské prezentace) 

  7. Projekt  

  8. Obecně o paralelních korpusových zdrojích slovanských jazyků (IC, OPUS, PARASOL) 

  9. InterCorp 

  10. Srovnání národních tagsetů cs-pl, cs-ru, cs-sk, 

  11. Universal dependencies 

  12. Korpusový komparativní výzkum  
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html