SubjectsSubjects(version: 861)
Course, academic year 2019/2020
  
Corpora of spoken language - ALINV359M
Title: Korpusy mluveného jazyka
Guaranteed by: Institute of Linguistics (21-ULING)
Faculty: Faculty of Arts
Actual: from 2015
Semester: both
Points: 0
E-Credits: 3
Examination process:
Hours per week, examination: 0/2 C [hours/week]
Capacity: winter:unknown / unknown (unknown)
summer:unknown / unknown (unknown)
Min. number of students: unlimited
State of the course: taught
Language: Czech
Teaching methods: full-time
Level:  
Is provided by: AMLV00042
Explanation: Další informace lze najít po kliknutí na kód předmětu, který výuku zajišťuje.
Note: course can be enrolled in outside the study plan
enabled for web enrollment
you can enroll for the course in winter and in summer semester
Guarantor: PhDr. Mgr. Marie Kopřivová, Ph.D.
Annotation -
Last update: Mgr. Lucie Lukešová, Ph.D. (01.02.2018)
The course focuses on spoken corpora: their building, design as well as use. Participants will get acquianted with
spoken corpora of Czech and other languages, learn about the methods of data collection, transcription and
transcription programs. They will learn how to query the corpora of spoken Czech (ORAL, ORTOFON, DIALEKT,
DIALOG) in the KonText interface, on the website dialogy.net and using the SyD tool.

In the hands-on part, we will examine specific features of spoken language based on corpus data.
Discussion of selected research articles is an integral part of the course.
Course completion requirements -
Last update: Mgr. Dominika Kováříková, M.A., Ph.D. (08.12.2019)

Requirements:

Literature -
Last update: Mgr. Dominika Kováříková, M.A., Ph.D. (08.12.2019)

Readings:

Čermáková, A. – Kopřivová, M. (2018): Korpusový výzkum mluveného jazyka na příkladu češtiny a angličtiny: současný stav. SaS 79/2018, č. 3, 217-240
Čmejrková, S. - Hoffmannová, Jana(eds): Mluvená čeština: hledání funkčního rozpětí. Academia. Praha 2011.

Čmejrková, S. – Jílková, L. – Kaderka, P. (2004): Mluvená čeština v televizních debatách: korpus DIALOG. Slovo a slovesnost, 65, s. 243–269.

Hoffmannová, J. – Zeman, J. (2017): Výzkum syntaxe mluvené češtiny: inventarizace problémů. SaS, 78, č. 1. , 45-66.

Kopřivová, M. - Komrsková, Z.   Lukeš, D. -  Poukarová, P. (2017): Korpus ORAL: sestavení, lemmatizace a morfologické značkování. KGA,  47-67. ISSN 1804-137X.

Kopřivová, M. - Waclawičová, M. (eds): Čeština v mluveném korpusu. NLN, Praha 2008. 

Merkel, S. - Schmidt, T.: Korpora gesprochener Sprache im Netz - eine Umschau.
(http://www.gespraechsforschung-ozs.de/heft2009/px-merkel.pdf)

Miller, J. - Weinert, R.: Spontaneous Spoken Language. Syntax and Discourse. Clarendon Press. Oxford 1998.

Syllabus - Czech
Last update: Mgr. Dominika Kováříková, M.A., Ph.D. (08.12.2019)

Probíraná témata:

1)      Mluvený jazyk a jeho specifika

2)      Vytváření mluvených korpusů

3)      Typy korpusů mluveného jazyka , korpusy mluvené češtiny

4)      Pořizování nahrávek, výběr mluvčích, anonymizace

5)      Otázky transkripce (trankripční programy: Transcribere, ELAN, EXMERALDA)

6)      Morfologická anotace mluvené češtiny

7)      Světové korpusy mluveného jazyka

8)      Práce s mluvenými korpusy (ORAL, ORTOFON, DIALEKT – korpusový manažer Kontext)

9)      Mluvený jazyk v NLP

10)      Specifické jevy mluvené češtiny

 

 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html