SubjectsSubjects(version: 916)
Course, academic year 2022/2023
   Login via CAS
Corpora of spoken language - ALINV378M
Title: Korpusy mluveného jazyka
Guaranteed by: Institute of Linguistics (21-ULING)
Faculty: Faculty of Arts
Actual: from 2020
Semester: both
Points: 0
E-Credits: 4
Examination process:
Hours per week, examination: 0/2, C [HT]
Capacity: winter:unknown / unknown (unknown)
summer:unknown / unknown (unknown)
Min. number of students: unlimited
Virtual mobility / capacity: no
State of the course: taught
Language: Czech
Teaching methods: full-time
Level:  
Is provided by: AMLV00042
Explanation: Další informace lze najít po kliknutí na kód předmětu, který výuku zajišťuje.
Note: course can be enrolled in outside the study plan
enabled for web enrollment
you can enroll for the course in winter and in summer semester
Guarantor: PhDr. Mgr. Marie Kopřivová, Ph.D.
Annotation -
Last update: PhDr. Mgr. Marie Kopřivová, Ph.D. (18.09.2020)
The course focuses on spoken corpora: their building, design as well as use. Participants will get acquianted with spoken corpora of Czech and other languages, learn about the methods of data collection, transcription and transcription programs. They will learn how to query the corpora of spoken Czech (ORAL, ORTOFON, DIALEKT, DIALOG) in the KonText interface, on the website dialogy.net and using the SyD tool.
In the hands-on part, we will examine specific features of spoken language based on corpus data. <br>
Discussion of selected research articles is an integral part of the course.
The course is taught mainly in Czech and therefore requires sufficient proficiency in order to attend

Course completion requirements -
Last update: PhDr. Mgr. Marie Kopřivová, Ph.D. (14.09.2020)

Requirements:


1) elaboration and participation of continuously assigned tasks: discussion on a topic based on literature and corpus data analysis

2) presenatition of a corpus of spoken language

3) test of skills for use with Czech spoken corpora

Literature -
Last update: Mgr. Dominika Kováříková, M.A., Ph.D. (08.12.2019)

Readings:

Čermáková, A. – Kopřivová, M. (2018): Korpusový výzkum mluveného jazyka na příkladu češtiny a angličtiny: současný stav. SaS 79/2018, č. 3, 217-240
Čmejrková, S. - Hoffmannová, Jana(eds): Mluvená čeština: hledání funkčního rozpětí. Academia. Praha 2011.

Čmejrková, S. – Jílková, L. – Kaderka, P. (2004): Mluvená čeština v televizních debatách: korpus DIALOG. Slovo a slovesnost, 65, s. 243–269.

Hoffmannová, J. – Zeman, J. (2017): Výzkum syntaxe mluvené češtiny: inventarizace problémů. SaS, 78, č. 1. , 45-66.

Kopřivová, M. - Komrsková, Z.   Lukeš, D. -  Poukarová, P. (2017): Korpus ORAL: sestavení, lemmatizace a morfologické značkování. KGA,  47-67. ISSN 1804-137X.

Kopřivová, M. - Waclawičová, M. (eds): Čeština v mluveném korpusu. NLN, Praha 2008. 

Merkel, S. - Schmidt, T.: Korpora gesprochener Sprache im Netz - eine Umschau.
(http://www.gespraechsforschung-ozs.de/heft2009/px-merkel.pdf)

Miller, J. - Weinert, R.: Spontaneous Spoken Language. Syntax and Discourse. Clarendon Press. Oxford 1998.

Syllabus - Czech
Last update: Mgr. Dominika Kováříková, M.A., Ph.D. (08.12.2019)

Probíraná témata:

1)      Mluvený jazyk a jeho specifika

2)      Vytváření mluvených korpusů

3)      Typy korpusů mluveného jazyka , korpusy mluvené češtiny

4)      Pořizování nahrávek, výběr mluvčích, anonymizace

5)      Otázky transkripce (trankripční programy: Transcribere, ELAN, EXMERALDA)

6)      Morfologická anotace mluvené češtiny

7)      Světové korpusy mluveného jazyka

8)      Práce s mluvenými korpusy (ORAL, ORTOFON, DIALEKT – korpusový manažer Kontext)

9)      Mluvený jazyk v NLP

10)      Specifické jevy mluvené češtiny

 

 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html