PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Práce s jazykovými korpusy - ADE120020
Anglický název: Work with Language Corpora
Zajišťuje: Ústav germánských studií (21-UGS)
Fakulta: Filozofická fakulta
Platnost: od 2023
Semestr: zimní
Body: 0
E-Kredity: 3
Způsob provedení zkoušky: zimní s.:
Rozsah, examinace: zimní s.:0/2, Z [HT]
Počet míst: neurčen / neomezen (neurčen)
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Kompetence:  
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Úroveň:  
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
Garant: Mgr. Věra Hejhalová, Ph.D.
Vyučující: Mgr. Věra Hejhalová, Ph.D.
Anotace -
Poslední úprava: Mgr. Věra Hejhalová, Ph.D. (04.10.2023)
Práce s jazykovými korpusy je předmětem, v němž se studenti bakalářského studia seznámí s existencí jazykových korpusů a s možnostmi jejich využití v lingvistické praxi. Kurz je zaměřen na praktickou práci a je předstupněm k Semináři z korpusové lingvistiky, který následuje v NMgr. programu. Kromě seznámení se se základními druhy a vlastnostmi korpusů je důraz kladen na praktickou využitelnost korpusů v každodenním životě lingvisty. Důraz se klade na korpusy češtiny (ČNK) a němčiny (DeReKo a DWDS) vč. přidružených aplikací Kookkurrenzanalyse, CCDB, SOM, resp. Treq, SyD, Morfio, WaG ad. V oblasti využitelnosti jsou reflektovány potřeby studentů s ohledem na jejich bádání a psaní seminárních a závěrečných prací z ostatních disciplín.
Cíl předmětu -
Poslední úprava: Mgr. Věra Hejhalová, Ph.D. (04.10.2023)

Základní seznámení s prací s jazykovými korpusy s cílem porozumět jejich funkci a dokázat je využít prakticky ve svém dalším studiu.

Podmínky zakončení předmětu -
Poslední úprava: Mgr. Věra Hejhalová, Ph.D. (04.01.2024)

1)    Absence max. 3

2)    Průběžná příprava do hodin

3)    aktivní účast na řešení zadaných úkolů

4) zpracování jedné přidělené publikace pro potřeby InterCorpu nebo ověření praktické znalosti práce s korpusy ve formě otestování v posledním týdnu

UPRAVENÉ PODMÍNKY ZÁPOČTU PRO ZKOUŠKOVÉ OBDOBÍ ZS 2023/24: Zápočtové úlohy skládají studenti online ve stanovený čas, na který se přihlásili v SISu. Během psaní zápočtového testu mají možnost konzultovat s vyučující synchronně online přes MS Teams případné otázky. 

Literatura -
Poslední úprava: Mgr. Věra Hejhalová, Ph.D. (04.10.2023)

Doporučená literatura:

BUBENHOFER, Noah: Einführung in die Korpuslinguistik: Praktische Grundlagen und Werkzeuge. – Online-Kurs

ČERMÁK, F. et al.: Studie z korpusové lingvistiky, úvod, edice a překlad, Karolinum 2000.

ČERMÁK, F./BLATNÁ, R. (ed.): Studie z korpusové lingvistiky 1, Korpusová lingvistika, stav a modelové přístupy, NLN Praha 2006.

ČERMÁK, F./BLATNÁ, R.: Jak využívat Český národní korpus, NLN Praha 2005.

ČERMÁK, F./ŠULC, M.(ed.): Studie z korpusové lingvistiky 2, Kolokace, NLN Praha 2006.

ČERMÁK, F.: Korpusová lingvistika Praha 2011. Vyd. 1. Praha: NLN, Nakladatelství Lidové noviny, 2011, 372 s. ISBN 9788074221149.

ČERMÁK, František. Korpusová lingvistika Praha 2011. Vyd. 1. Praha: NLN, Nakladatelství Lidové noviny, 2011, 323 s. ISBN 9788074221156.

KOCEK, J./KOPŘIVOVÁ, M./KUČERA, K. (ed.): Český národní korpus. Úvod a příručka uživatele, Praha 2000.

KOPŘIVOVÁ, Marie: Jak využívat Český národní korpus, Praha 2005.

LEMNITZER, Lothar a Heike ZINSMEISTER. Korpuslinguistik. Eine Einführung. Tübingen: Gunter Narr, 2006, 220 s. ISBN 3-8233-6210-0.

LÜDELING, Anke / MAIK Walter: Korpuslinguistik für Deutsch als Fremdsprache. Sprachvermittlung und Spracherwerbsforschung. (.pdf – zugänglich unter https://www.linguistik.hu-berlin.de/de/institut/professuren/korpuslinguistik/mitarbeiter-innen/anke/pdf/LuedelingWalterDaF.pdf)

LÜDELING, Anke a Merja KYTÖ. Corpus linguistics: an international handbook. Berlin: Walter de Gruyter, c2008, xvii, 776 s. ISBN 9783110180435.

LÜDELING, Anke a Merja KYTÖ. Corpus linguistics: an international handbook. Berlin: Walter de Gruyter, c2008, xvii, s. 778-1353. ISBN 9783110207330.

PERKUHN, Rainer a Cyril BELICA. Korpuslinguistik - das unbekannte Wesen oder Mythen über Korpora und Korpuslinguistik. In: Sprachreport 1/2006. S. 2-8. Mannheim: 2006.

PERKUHN, Rainer, Holger KEIBEL a Marc KUPIETZ. Korpuslinguistik. Paderborn: Wilhelm Fink, 2012, 144 s. ISBN 9783825234331.

PETKEVIČ, Vladimír a Alexandr ROSEN. Korpusová lingvistika Praha 2011. Vyd. 1. Praha: Nakladatelství Lidové noviny, 2011, 225 s. ISBN 9788074221163.

ŠEBESTA, K./ŠORMOVÁ, K. et al.: Korpusy v jazykovém vyučování, Praha: FFUK, 2019, zdarma ke stažení zde: https://e-shop.ff.cuni.cz/e_knihy/e_publikace/korpusy_v_jazykovem_vyucovani_pdf_-1761

ŠEBESTA, K./ŠORMOVÁ, K. et al.: Korpusy v jazykovém vyučování II. Praha: FF UK 2019, zdarma ke stažení zde https://e-shop.ff.cuni.cz/e_knihy/e_publikace/korpusy_v_jazykovem_vyucovani_ii_pdf_-1908

ŠULC, Michal: Korpusová lingvistika. První vstup, Praha 1999.

 

Internetové odkazy:

www.ids-mannheim.de

https://cosmas2.ids-mannheim.de/cosmas2-web/

http://corpora.ids-mannheim.de/ccdb/

http://ucnk.ff.cuni.cz

https://www.korpus.cz/

 

Další odborná literatura:

ABEL, Andrea/Renata ZANIN: Korpora in Lehre und Forschung. Bozen-Bolzano University Press, Bozen 2011, ISBN 978-88-6046-040-0

BELICA, Cyril a Kathrin STEYER. Korpusanalytische Zugänge zu sprachlichem Usus. In: Beiträge zur bilingualen Lexikographie, M. Vachková (Hg.), AUC (Acta Universitatis Carolinae), GERMANISTICA PRAGENSIA XX, Praha: Karolinum, 2008.

BUHOFER, Annelies a Gertrud GRÉCIANO, (eds.): Flut von Texten - Vielfalt der Kulturen. Ascona 2001 zur Methodologie und Kulturspezifik der Phraseologie. (=Phraseologie und Parömiologie 14). Baltmannsweiler, S. 33-46. 2003.

KÁŇA, Tomáš a Hana PELOUŠKOVÁ (eds.): Deutsch und Tschechisch im Vergleich – korpusbasierte linguistische Studien, Brno: Masarykova univerzita, 2009.

KOPŘIVOVÁ, Marie: Využití korpusu při zpracování frazeologie ve výkladovém slovníku, In: Frazeografia sĺowińska. 1. vyd. Opole: Wydawnictwo Uniwersytetu Opolskiego; 2001

KRATOCHVÍLOVÁ, Iva a Norbert Richard WOLF (eds.): Kompendium Korpuslinguistik: eine Bestandaufnahme aus deutsch-tschechischer Perspektive, Heidelberg, Winter, 2010.

KRATOCHVÍLOVÁ, Iva.  Zum aktuellen Thema: Die Korpuslinguistik im deutsch-tschechischen Sprachvergleich, In: Acta Facultatis Ostraviensis, Studia Germanistica, Ostrava, Ostravská univerzita v Ostravě, 2006, S. 35–45.

LEMNITZER, Lothar a Heike ZINSMEISTER. Korpuslinguistik. Eine Einführung. Tübingen: Gunter Narr, 2006, 220 s. ISBN 3-8233-6210-0.

KRATOCHVÍLOVÁ, Iva (Hrsg.): Kompendium Korpuslinguistik: eine Bestandaufnahme aus deutsch-tschechischer Perspektive, Heidelberg, Winter, 2010.

MOON, Rosamund: Fixed Expressions and Idioms in English: A Corpus-Based Approach. Oxford Studies In Lexicography & Lexicology. Oxford University Press, 1998.

PELOUŠKOVÁ, Hana a Tomáš KÁŇA: Elektronische Korpora in Tschechien und das tschechisch-deutsche Parallelkorpus, In: Planning, Gluing and Painting Corpora, B. Kettemann - G. Marko (eds.), Frankfurt am Main, Peter Lang GmbH, 2006,  S. 27–46.

STEYER, Kathrin: Korpus, Statistik, Kookkurrenz. Lässt sich Idiomatisches "berechnen"? In: Burger, Harald/Häcki, Buhofer, Annelies/Gréciano, Gertrud (eds.): Flut von Texten - Vielfalt der Kulturen. Ascona 2001 zur Methodologie und Kulturspezifik der Phraseologie. (=Phraseologie und Parömiologie 14). Baltmannsweiler, S. 33-46. 2003.

Metody výuky -
Poslední úprava: Mgr. Věra Hejhalová, Ph.D. (04.10.2023)

cvičení, seminář, společná práce, diskuse

Sylabus -
Poslední úprava: Mgr. Věra Hejhalová, Ph.D. (04.10.2023)

1. Co je to korpus? Jak vzniká? K čemu slouží? Jak ho lze využít? Základní typologie korpusů. Korpusy češtiny a němčiny (DeReKo, ČNK, InterCorp) formou prezentace a společné práce. Podmínky a vytvoření zázemí pro práci s korpusy (laptopy, přístup na internet, registrace do COSMAS II a ČNK. Vyhledání jednoduchých výrazů a společný brainstorming nad možnostmi využití korpusů, jejich mezemi a interpretací.

2.  Zpracovávání textů do korpusů (prezentace), stručný vývoj disciplíny, základní terminologie (token, type, lemma, parser, desambiguace, korpus X korpusový manažer, konkordance ad.). Základní schéma vyhledávání v (COSMAS II.) – výběr archivu, korpusu, formulace nejjednodušších dotazů.

3.  DeReKo (IDS Mannheim) - COSMAS II. - základní funkce korpusového vyhledavače;  Procvičování základního vyhledávání v COSMAS II., regulární znaky, možnosti nastavení (Optionen)

4.  Pokročilé vyhledávání a jeho procvičování v COSMAS II.; víceslovná spojení

5.  Rozšiřující funkce z nabídky COSMAS II.; práce s taggovanými korpusy

6.  Kookkurenční analýza - způsob zadání a vyhodnocování vygenerovaných dat;  procvičování CQL (Corpus Query Language) ; frazémy a kolokace- zvláštní úkol pro korpusovou lingvistiku

7.  Přidružené aplikace – CCDB, SOM apod.; DWDS

8.  Český národní korpus - základní informace, základní vyhledávání

10. Český národní korpus - procvičování vyhledávání, vysvětlení rozšiřujících funkcí,

11. InterCorp

12. SyD, Morfio, Treq, KWords, WaG

13. Závěrečná diskuze nad problematikou korpusové lingvistiky, zadávání závěrečných prací, příp. zápočtový test

Vstupní požadavky -
Poslední úprava: Mgr. Věra Hejhalová, Ph.D. (04.10.2023)

Kurz je veden částečně v češtině a částečně v němčině. V kurzu se pracuje s korpusy češtiny a němčiny. Přihlášení studenti by měli ovládat němčiny na min. úrovni B1 podle SERR.

 
Univerzita Karlova | Informační systém UK