SubjectsSubjects(version: 945)
Course, academic year 2023/2024
   Login via CAS
Spoken Language Corpora - AMLV00042
Title: Korpusy mluveného jazyka
Guaranteed by: Institute of Czech and Deaf Studies (21-UBN)
Faculty: Faculty of Arts
Actual: from 2023
Semester: both
Points: 2
E-Credits: 3
Examination process:
Hours per week, examination: 0/2, C [HT]
Extent per academic year: 2 [hours]
Capacity: winter:unknown / unknown (10)
summer:unknown / unknown (10)
Min. number of students: unlimited
4EU+: no
Virtual mobility / capacity: no
Key competences:  
State of the course: taught
Language: Czech
Teaching methods: full-time
Teaching methods: full-time
Level:  
Note: course can be enrolled in outside the study plan
enabled for web enrollment
you can enroll for the course in winter and in summer semester
Guarantor: PhDr. Mgr. Marie Kopřivová, Ph.D.
Teacher(s): PhDr. Mgr. Marie Kopřivová, Ph.D.
Annotation -
Last update: PhDr. Mgr. Marie Kopřivová, Ph.D. (09.02.2024)
The course focuses on spoken corpora: their building, design as well as use. Participants will get acquianted with spoken corpora of Czech and other languages, learn about the methods of data collection, transcription and transcription programs. They will learn how to query the corpora of spoken Czech (ORAL, ORTOFON, DIALEKT, DIALOG) in the KonText interface, on the website dialogy.net and using the SyD tool.
In the hands-on part, we will examine specific features of spoken language based on corpus data. <br>
Discussion of selected research articles is an integral part of the course.
The course is taught mainly in Czech and therefore requires sufficient proficiency in order to attend

Course completion requirements -
Last update: PhDr. Mgr. Marie Kopřivová, Ph.D. (09.02.2024)

Requirements:


1) elaboration and participation of continuously assigned tasks: discussion on a topic based on literature and corpus data analysis

2) presenatition of a corpus of spoken language

3) test of skills for use with Czech spoken corpora

Literature -
Last update: PhDr. Mgr. Marie Kopřivová, Ph.D. (09.02.2024)

Readings:

Čermáková, A. – Kopřivová, M. (2018): Korpusový výzkum mluveného jazyka na příkladu češtiny a angličtiny: současný stav. SaS 79/2018, č. 3, 217-240
Čmejrková, S. - Hoffmannová, Jana(eds): Mluvená čeština: hledání funkčního rozpětí. Academia. Praha 2011.

Čmejrková, S. – Jílková, L. – Kaderka, P. (2004): Mluvená čeština v televizních debatách: korpus DIALOG. Slovo a slovesnost, 65, s. 243–269.

Hoffmannová, J. – Homoláč, J. – Mrázková, K. (eds.): Syntax mluvené češtiny. Praha: Academia 2019.Hoffmannová, J.: Styl doprovodných dialogů. Jazykovedný časopis, 73, č. 1, 2022, s. 86-100. [pdf]

Hoffmannová, J. – Zeman, J.: Výzkum syntaxe mluvené češtiny: vstupní inventarizace problémů. Slovo a slovesnost 78, 2017, 45–66. [pdf]

Homoláč, J. – Mareš, P. – Hoffmannová, J. – Jílková, L. – Kopecký, J. – Mrázková, K.: Míšení žánrů, stylů a diskurzů v internetové komunikaci. Praha: Academia 2022.

Kopřivová M.: To je hrozný no . ale zas jako jsou kreativní : Evaluativní reakce v každodenní komunikaci. Czech language news, 2022, č. • no. 2022, s. • p. 7-22. ISSN 1095-2950.

Kopřivová, M. - Komrsková, Z.   Lukeš, D. -  Poukarová, P. (2017): Korpus ORAL: sestavení, lemmatizace a morfologické značkování. KGA,  47-67. ISSN 1804-137X.

Kopřivová M., Laubeová Z., Lukeš D.: Designing a corpus of Czech monologues: ORATOR v2. Jazykovedný Časopis, 2021, č. • no. 72, s. • p. 520-530. ISSN 0021-5597.

Kopřivová M., Laubeová Z., Poukarová P., Lukeš D.: Relevant criteria for selection of spoken data: Theory meets practice. Jazykovedný Časopis, 2019, č. • no. 70, s. • p. 324-335. ISSN 0021-5597.

Kopřivová, M. - Waclawičová, M. (eds): Čeština v mluveném korpusu. NLN, Praha 2008. 

Lukeš D., Kopřivová M., Komrsková Z., Poukarová P.: Pronunciation Variants and ASR of Colloquial Speech: A Case Study on Czech. In Calzolari N., Choukri K., Cieri C., Declerck T., et al.: Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). Miyazaki, European Language Resources Association (ELRA), 2018, s. • p. 2704-2709. ISBN 979-10-95546-00-9.

Merkel, S. - Schmidt, T.: Korpora gesprochener Sprache im Netz - eine Umschau.
(http://www.gespraechsforschung-ozs.de/heft2009/px-merkel.pdf)

Miller, J. - Weinert, R.: Spontaneous Spoken Language. Syntax and Discourse. Clarendon Press. Oxford 1998.

Syllabus - Czech
Last update: PhDr. Mgr. Marie Kopřivová, Ph.D. (09.02.2024)

Probíraná témata:

1)      Mluvený jazyk a jeho specifika

2)      Vytváření mluvených korpusů

3)      Typy korpusů mluveného jazyka , korpusy mluvené češtiny

4)      Pořizování nahrávek, výběr mluvčích, anonymizace

5)      Otázky transkripce (trankripční programy: Transcribere, ELAN, EXMERALDA)

6)      Morfologická anotace mluvené češtiny

7)      Světové korpusy mluveného jazyka

8)      Práce s mluvenými korpusy (ORAL, ORTOFON, DIALEKT – korpusový manažer Kontext)

9)      Mluvený jazyk v NLP

10)     Specifické jevy mluvené češtiny

 

 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html