PředmětyPředměty(verze: 811)
Předmět, akademický rok 2017/2018
   Přihlásit přes CAS
Korpusová lingvistika - úvod zaměřený na češtinu - ALINV152B
Anglický název: Corpus linguistics - introduction focused on Czech
Zajišťuje: Ústav obecné lingvistiky (21-ULING)
Fakulta: Filozofická fakulta
Platnost: od 2015
Semestr: oba
Body: 0
E-Kredity: 4
Způsob provedení zkoušky:
Rozsah, examinace: 0/2 Zk [hodiny/týden]
Počet míst: zimní:neurčen / neurčen (neurčen)
letní:neurčen / neurčen (neurčen)
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Úroveň:  
Je zajišťováno předmětem: AMLV00008
Vysvětlení: Další informace lze najít po kliknutí na kód předmětu, který výuku zajišťuje.
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
předmět lze zapsat v ZS i LS
Garant: doc. Mgr. Václav Cvrček, Ph.D.
Neslučitelnost : ALF400086, ALF400222, ALF400223
Rozvrh   Nástěnka   
Anotace
Poslední úprava: Mgr. Lucie Chlumská, Ph.D. (07.02.2014)

Seminář je určen bohemistům a dalším zájemcům o práci s jazykovým korpusem. Po absolvování semináře budou studenti schopni samostatně využívat korpusy psané a mluvené češtiny pro svou vlastní lingvistickou práci. Naučí se pracovat s korpusovým manažerem KonText a dalšími nástroji pro práci s korpusem, seznámí se s jazykovým materiálem v korpusech ČNK (především se synchronními psanými a mluvenými korpusy). V rámci samostatného výzkumu dokážou vyhledat a interpretovat lingvistický jev.
Počet studentů v semináři je z kapacitních důvodů omezen na 10.

Požadavky k zápočtu: aktivní účast na seminářích, test, samostatné zpracování lingvistického jevu korpusovými metodami.
Literatura
Poslední úprava: Mgr. Lucie Chlumská, Ph.D. (07.02.2014)

Povinná literatura

Baker, P.: Using Corpora in Discourse Analysis. Continuum, London 2006. (úvodní kapitola)

Čermáková, A.: Valence českých substantiv. Studie z korpusové lingvistiky, svazek 9. NLN, Praha 2009. (úvodní kapitola)

Cvrček, V. - Kováříková, D.: Možnosti a meze korpusové lingvistiky. Naše řeč 94/3, 2011 (s. 113-133).

Doporučená literatura

Bartoň, T. a kol.: Statistiky češtiny. NLN, Praha 2009.

Cvrček, V. a kol..: Mluvnice současné češtiny /Grammar of Contemporary Czech/. Karolinum. Praha 2010, (353 s.).

Biber, D. et al.: Corpus Linguistics: Investigating Language Structure and Use. Cambridge University Press, Cambridge 1998.

Oakes, M. P.: Statistics for Corpus Linguistics. Edinburg University Press, Edinburg 1998.

Teubert, W. - Krishnamurthy, R. (eds.): Corpus Linguistics Vol. I-VI. Critical Concepts in Linguistics, Routledge 2007.

Sylabus
Poslední úprava: Mgr. Lucie Chlumská, Ph.D. (07.02.2014)

Rozpis témat

Následující témata budou při vyučování pokryta. Každý vyučující má individuální přístup k rozvržení hodin (pořadí témat) i v důrazu na jednotlivá témata.

·         Co je korpus; korpusy ČNK

·         Korpusová lingvistika

·         Otázka reprezentativnosti psaných a mluvených korpusů, žánrová rozrůzněnost

·         Značkování korpusu - lemmatizace a morfologické značkování; struktura korpusu

·         Vyhledání a interpretace konkordance

·         Frekvenční analýza (lemmat, slovních tvarů, žánrů, kontextu apod.)

·         Pokročilé vyhledávání: CQL a regulární výrazy

·         Kolokace, koligace, sémantická prozodie

·         Korpusový materiál ve výzkumu jednotlivých jazykových rovin

·         Základy zpracování dat (práce s Excelem, vytváření tabulek a grafů)

·         Základy statistiky pro práci s korpusem

·         Korpusové nástroje SyD, Morfio, KWords

·         Specializované korpusy (Diakorp, InterCorp, autorské korpusy)

·         Zpracování rozsáhlejšího lingvistického výzkumu (např. bakalářská/diplomová práce) na základě korpusových dat

 
Univerzita Karlova | Informační systém UK