PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Korpusy mluveného jazyka - AMLV00042
Anglický název: Spoken Language Corpora
Zajišťuje: Ústav bohemistiky pro cizince a komunikaci neslyšících (21-UBN)
Fakulta: Filozofická fakulta
Platnost: od 2023
Semestr: oba
Body: 2
E-Kredity: 3
Způsob provedení zkoušky:
Rozsah, examinace: 0/2, Z [HT]
Rozsah za akademický rok: 2 [hodiny]
Počet míst: zimní:neurčen / neurčen (10)
letní:neurčen / neurčen (10)
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Kompetence:  
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Úroveň:  
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
předmět lze zapsat v ZS i LS
Garant: PhDr. Mgr. Marie Kopřivová, Ph.D.
Vyučující: PhDr. Mgr. Marie Kopřivová, Ph.D.
Anotace -
Poslední úprava: PhDr. Mgr. Marie Kopřivová, Ph.D. (09.02.2024)

Kurs uvádí účastníky do problematiky budování a využívání korpusů mluveného jazyka. Účastníci se seznámí s korpusy mluvené češtiny i dalších jazyků, se způsoby sběru dat, jejich transkripcí a trankripčními programy. Naučí se pracovat s korpusy mluvené češtiny (ORAL, ORTOFON, DIALEKT, DIALOG) v rozhraní Kontext, dialogy.org a SyD. Praktická část bude zaměřena na zkoumání jevů mluveného jazyka prostřednictvím korpusových dat. Nedílnou součástí kurzu je i diskuse nad vybranou odbornou literaturou.<br>
Podmínky zakončení předmětu -
Poslední úprava: PhDr. Mgr. Marie Kopřivová, Ph.D. (09.02.2024)

Podmínky zakončení předmětu:

1) vypracování a prezentace průběžně zadávaných úkolů: diskuse k tématu na základě odborné literatury a analýzy korpusových dat

2) prezentace jednoho zahraničního korpusu mluveného jazyka

3) kolokvium dovedností pro práci s korpusy mluvené češtiny

Literatura -
Poslední úprava: PhDr. Mgr. Marie Kopřivová, Ph.D. (09.02.2024)

Doporučená literatura:

Čermáková, A. – Kopřivová, M. (2018): Korpusový výzkum mluveného jazyka na příkladu češtiny a angličtiny: současný stav. SaS 79/2018, č. 3, 217-240
Čmejrková, S. - Hoffmannová, Jana(eds): Mluvená čeština: hledání funkčního rozpětí. Academia. Praha 2011.

Čmejrková, S. – Jílková, L. – Kaderka, P. (2004): Mluvená čeština v televizních debatách: korpus DIALOG. Slovo a slovesnost, 65, s. 243–269.

Hoffmannová, J. – Zeman, J. (2017): Výzkum syntaxe mluvené češtiny: inventarizace problémů. SaS, 78, č. 1. , 45-66.

Kopřivová, M. - Komrsková, Z.   Lukeš, D. -  Poukarová, P. (2017): Korpus ORAL: sestavení, lemmatizace a morfologické značkování. KGA,  47-67. ISSN 1804-137X.

Kopřivová, M. - Waclawičová, M. (eds): Čeština v mluveném korpusu. NLN, Praha 2008. 

Merkel, S. - Schmidt, T.: Korpora gesprochener Sprache im Netz - eine Umschau.
(http://www.gespraechsforschung-ozs.de/heft2009/px-merkel.pdf)

Miller, J. - Weinert, R.: Spontaneous Spoken Language. Syntax and Discourse. Clarendon Press. Oxford 1998.

Další literatura bude doplňována v průběhu semináře.

Sylabus
Poslední úprava: PhDr. Mgr. Marie Kopřivová, Ph.D. (09.02.2024)

Probíraná témata:

1)      Mluvený jazyk a jeho specifika

2)      Vytváření mluvených korpusů

3)      Typy korpusů mluveného jazyka , korpusy mluvené češtiny

4)      Pořizování nahrávek, výběr mluvčích, anonymizace

5)      Otázky transkripce (trankripční programy: Transcribere, ELAN, EXMERALDA)

6)      Morfologická anotace mluvené češtiny

7)      Světové korpusy mluveného jazyka

8)      Práce s mluvenými korpusy (ORAL, ORTOFON, DIALEKT – korpusový manažer Kontext)

9)      Mluvený jazyk v NLP

10)     Specifické jevy mluvené češtiny

 

 
Univerzita Karlova | Informační systém UK