PředmětyPředměty(verze: 861)
Předmět, akademický rok 2019/2020
  
Korpuslinguistisches Seminar - ADE510008E
Anglický název: Corpus Linguistics Seminar
Zajišťuje: Zahraniční oddělení (21-ZO)
Fakulta: Filozofická fakulta
Platnost: od 2017
Semestr: zimní
Body: 0
E-Kredity: 3
Způsob provedení zkoušky: zimní s.:
Rozsah, examinace: zimní s.:0/2 Zk [hodiny/týden]
Počet míst: neurčen / neurčen (neurčen)
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: němčina
Způsob výuky: prezenční
Úroveň:  
Je zajišťováno předmětem: ADE510008
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
Garant: Mgr. Věra Hejhalová, Ph.D.
Třída: Exchange - 09.1 Modern EC Languages
Rozvrh   Nástěnka   
Anotace
Poslední úprava: Mgr. Věra Hejhalová, Ph.D. (29.09.2018)
Kurz navazuje na prakticky zaměřený kurz Cvičení z korpusové lingvistiky v bakalářském studiu. Je zaměřený teoretičtěji. Studenti se seznamují nejen s praktickým využitím korpusů, ale také s pozadím jejich užívání, metodologickými otázkami apod. Na konci kurzu jsou schopni využívat korpusy němčiny (DeReKo a DWDS) a češtiny (ČNK vč. InterCorpu) vč. přidružených aplikací (Kookkurrenzanalyse, CCDB, SOM, CNS, SyD, Morfio, Treq, KWords ad.) ve svém každodenním životě i při psaní vědecky orientovaných prací, jsou seznámeni s pozadím a hlubší problematikou korpusové lingvistiky a dokážou tak vhodně patřičná data získat, jakož i vyhodnotit.
Podmínky zakončení předmětu
Poslední úprava: Mgr. Věra Hejhalová, Ph.D. (29.09.2018)

 1. max. 3 absence
 2. 1 referát na zadané téma v délce 20-30 minut
 3. závěrečný test v zápočtovém týdnu - z teorie v rozsahu diskutovaných referátů a SZZK otázek, + přezkoušení praktických dovedností práce s korpusy

Literatura
Poslední úprava: Mgr. Věra Hejhalová, Ph.D. (29.09.2018)

Empfohlene Sekundärliteratur:

 • ČERMÁK, František. Korpusová lingvistika Praha 2011. Vyd. 1. Praha: NLN, Nakladatelství Lidové noviny, 2011, 372 s. ISBN 9788074221149.
 • ČERMÁK, František. Korpusová lingvistika Praha 2011. Vyd. 1. Praha: NLN, Nakladatelství Lidové noviny, 2011, 323 s. ISBN 9788074221156.
 • PETKEVIČ, Vladimír a Alexandr ROSEN. Korpusová lingvistika Praha 2011. Vyd. 1. Praha: Nakladatelství Lidové noviny, 2011, 225 s. ISBN 9788074221163.
 • LÜDELING, Anke a Merja KYTÖ. Corpus linguistics: an international handbook. Berlin: Walter de Gruyter, c2008, xvii, 776 s. ISBN 9783110180435.
 • LÜDELING, Anke a Merja KYTÖ. Corpus linguistics: an international handbook. Berlin: Walter de Gruyter, c2008, xvii, s. 778-1353. ISBN 9783110207330.
 • TEUBERT, Wolfgang a Anna ČERMÁKOVÁ. Corpus linguistics: a short introduction. London: Continuum, c2007, vi, 153 s. ISBN 9780826494818.
 • PERKUHN, Rainer, Holger KEIBEL a Marc KUPIETZ. Korpuslinguistik. Paderborn: Wilhelm Fink, 2012, 144 s. ISBN 9783825234331.
 • SCHERER, Carmen.  Korpuslinguistik. Heidelberg: Universitätsverlag Winter, 2006, 98 s. ISBN 9783825351649
 • LEMNITZER, Lothar a ZINSMEISTER Heike. Korpuslinguistik. Eine Einführung. Tübingen: Gunter Narr, 2006, 220 s. ISBN 3-8233-6210-0.
 • Belica, Cyril, Keibel, Holger, Kupietz, Marc a Rainer Perkuhn.

Web as Corpus: Kooperation mit der Universität Bologna. In: Sprachreport Sonderheft/März 2007. Auslandskooperationen des Instituts für Deutsche Sprache. S. 21-25 - Mannheim: 2007. (Sprachreport X/2007)

 (http://pub.ids-mannheim.de/laufend/sprachreport/pdf/sr07-sonderheft.pdf)

 • KILGARRIFF, Adam. Googleology is Bad Science. In: Computational linguistics [online]. 2007, Jg. 33, Nr. 1, S. 147-151. ISSN 0891-2017.

        (http://www.kilgarriff.co.uk/Publications/ 2007-K-CL-Googleology.pdf)

 • www.korpus.cz – nové rozhraní KonText pro práci s korpusy ČNK

Sylabus
Poslední úprava: Mgr. Věra Hejhalová, Ph.D. (29.09.2018)

1.10.2018 Einleitungsstunde, Organisatorisches

Theorie

 • Korpus, seine Struktur, seine Zweckdienlichkeit, seine Arten, Geschichte, Allgemeines usw. 

Praktischer Teil

 • Korpusregistrierung, Basisorientierung im COSMAS II.

 

8.10.2018 – 2. Stunde

Theorie

 • Zusammensetzung der Korpora, Repräsentativität, Ausgewogenheit, Bearbeitung (tagging, tokenizace, desambiguace, parsing), Normativität usw.

 Praktischer Teil

 • Probe des Zugangs (eduroam, COSMAS II., COSMAS II – online, ČNK, InterCorp)
 • Suche in DeReKo, grundsätzliche Suchanfragen, ausgewählte Probleme
 • Sammlung eigener Ideen/Problemstellen bei Erstellung der Suchanfragen

 

 

15.10.2018 – 3. Stunde

Theorie

 • Mannheimer Korpora – Geschichte, Umfang, Zusammensetzung, Such- und Analysemöglichkeiten (DeReKo, COSMAS II.), AGD (Archiv für Gesprochenes Deutsch)

 Praktischer Teil

 • Anwendung: Suche in Mannheimer Korpora – kompliziertere Suchanfragen
 • Suchergebnisse auswerten

 

 

22.10.2018 – 4. Stunde

Theorie:

 • Internet als Korpus? Suchmöglichkeiten, Quellen, Vorteile, Nachteile, WaC

 Praktischer Teil

 • Suche in Mannheimer Korpora – kompliziertere Suchanfragen
 • Suchergebnisse auswerten
 • Vergleich mit den Suchmöglichkeiten in Google

 

29.10.2018 – 5. Stunde

Theorie

 • Český národní korpus - Geschichte, Umfang, Zusammensetzung, Such- und Analysemöglichkeiten; Diachrone Korpora; Korpora der gesprochenen Sprache – Ausnutzung, Umfang, Zweckdienlichkeit: (ohne InterCorp)

 Praktischer Teil

 • DeReKo-Reste
 • Such- und Analysemöglichkeiten in ČNK – KonText, T-Score, MI-Score

 

5.11.2018 – 6. Stunde

Theorie

 • Parallelkorpus InterCorp - Geschichte, Umfang, Zusammensetzung, Such- und Analysemöglichkeiten

Praktischer Teil

 • Such- und Analysemöglichkeiten in ČNK
 • Park, KonText

 

12.11.2018 – 7. Stunde

Theorie

 • Korpuslexikographie – Realität, Vision, corpus-based, -driven, elexiko, OWID, eVALBU, SYD, WordNet, DWDS, Ausnutzung der Korpora für Lexikographie – konkrete Möglichkeiten. 

 Praktischer Teil

 • Such- und Analysemöglichkeiten in DeReKo und ČNK
 • KonText
 • lexikographische Bearbeitung eines Stichwortes auf Grund der korpusbasierten und korpusanalytischen Anfragen + Vergleich mit bestehenden Wörterbüchern

 

19.11. 2018 – 8. Stunde

Theorie

 • Phraseologieforschung und Korpora (corpus-based/-driven; Kookkurrenzanalyse, CCDB, Kollokation, Kookkurrenz, Kolligation usw.)

 Praktischer Teil

 • Suche der komplizierten Wortverbindungen in DeReKo und ČNK

 

23.11.2018 – 9. Stunde

Theorie

 • Korpora für didaktische Zwecke

 Praktischer Teil

 • Kookkurrenzanalyse, CCDB – Suchen, Ergebnisse auswerten und verstehen

 

3.12.2018 – 10. Stunde

Praktischer Teil

 • ČNK, Filter, statistische Maße
 • Applikationen – SyD, Morfio, Treq

 

10.12.2018 – 11. Stunde

Praktischer Teil

 • ČNK, InterCorp

 

17.12.2018 – 12. Stunde

Praktischer Teil

 • DWDS
 • Reste

7.1.2019 – 13. Stunde

 • kurzer schriftlicher Test zur Theorie der Korpuslinguistik
 • praktisches Überprüfen der Such- und Analysefähigkeiten und Kenntnisse

Požadavky k zápisu
Poslední úprava: Mgr. Věra Hejhalová, Ph.D. (29.09.2018)

Předmět je určen pro studenty navazujícího magisterského studia. Pro studenty bakalářského studia je určen kurz Práce s korpusy, který je vypisován v LS.

 
Univerzita Karlova | Informační systém UK