PředmětyPředměty(verze: 861)
Předmět, akademický rok 2019/2020
  
Korpuslinguistisches Seminar - ADE510008E
Anglický název: Corpus Linguistics Seminar
Zajišťuje: Zahraniční oddělení (21-ZO)
Fakulta: Filozofická fakulta
Platnost: od 2017
Semestr: zimní
Body: 0
E-Kredity: 3
Způsob provedení zkoušky: zimní s.:
Rozsah, examinace: zimní s.:0/2 Zk [hodiny/týden]
Počet míst: neurčen / neurčen (neurčen)
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: němčina
Způsob výuky: prezenční
Úroveň:  
Je zajišťováno předmětem: ADE510008
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
Garant: Mgr. Věra Hejhalová, Ph.D.
Třída: Exchange - 09.1 Modern EC Languages
Rozvrh   Nástěnka   
Anotace
Poslední úprava: Mgr. Věra Hejhalová, Ph.D. (29.09.2018)
Kurz navazuje na prakticky zaměřený kurz Cvičení z korpusové lingvistiky v bakalářském studiu. Je zaměřený teoretičtěji. Studenti se seznamují nejen s praktickým využitím korpusů, ale také s pozadím jejich užívání, metodologickými otázkami apod. Na konci kurzu jsou schopni využívat korpusy němčiny (DeReKo a DWDS) a češtiny (ČNK vč. InterCorpu) vč. přidružených aplikací (Kookkurrenzanalyse, CCDB, SOM, CNS, SyD, Morfio, Treq, KWords ad.) ve svém každodenním životě i při psaní vědecky orientovaných prací, jsou seznámeni s pozadím a hlubší problematikou korpusové lingvistiky a dokážou tak vhodně patřičná data získat, jakož i vyhodnotit.
Podmínky zakončení předmětu
Poslední úprava: Mgr. Věra Hejhalová, Ph.D. (29.09.2018)

  1. max. 3 absence
  2. 1 referát na zadané téma v délce 20-30 minut
  3. závěrečný test v zápočtovém týdnu - z teorie v rozsahu diskutovaných referátů a SZZK otázek, + přezkoušení praktických dovedností práce s korpusy

Literatura
Poslední úprava: Mgr. Věra Hejhalová, Ph.D. (29.09.2018)

Empfohlene Sekundärliteratur:

  • ČERMÁK, František. Korpusová lingvistika Praha 2011. Vyd. 1. Praha: NLN, Nakladatelství Lidové noviny, 2011, 372 s. ISBN 9788074221149.
  • ČERMÁK, František. Korpusová lingvistika Praha 2011. Vyd. 1. Praha: NLN, Nakladatelství Lidové noviny, 2011, 323 s. ISBN 9788074221156.
  • PETKEVIČ, Vladimír a Alexandr ROSEN. Korpusová lingvistika Praha 2011. Vyd. 1. Praha: Nakladatelství Lidové noviny, 2011, 225 s. ISBN 9788074221163.
  • LÜDELING, Anke a Merja KYTÖ. Corpus linguistics: an international handbook. Berlin: Walter de Gruyter, c2008, xvii, 776 s. ISBN 9783110180435.
  • LÜDELING, Anke a Merja KYTÖ. Corpus linguistics: an international handbook. Berlin: Walter de Gruyter, c2008, xvii, s. 778-1353. ISBN 9783110207330.
  • TEUBERT, Wolfgang a Anna ČERMÁKOVÁ. Corpus linguistics: a short introduction. London: Continuum, c2007, vi, 153 s. ISBN 9780826494818.
  • PERKUHN, Rainer, Holger KEIBEL a Marc KUPIETZ. Korpuslinguistik. Paderborn: Wilhelm Fink, 2012, 144 s. ISBN 9783825234331.
  • SCHERER, Carmen.  Korpuslinguistik. Heidelberg: Universitätsverlag Winter, 2006, 98 s. ISBN 9783825351649
  • LEMNITZER, Lothar a ZINSMEISTER Heike. Korpuslinguistik. Eine Einführung. Tübingen: Gunter Narr, 2006, 220 s. ISBN 3-8233-6210-0.
  • Belica, Cyril, Keibel, Holger, Kupietz, Marc a Rainer Perkuhn.

Web as Corpus: Kooperation mit der Universität Bologna. In: Sprachreport Sonderheft/März 2007. Auslandskooperationen des Instituts für Deutsche Sprache. S. 21-25 - Mannheim: 2007. (Sprachreport X/2007)

 (http://pub.ids-mannheim.de/laufend/sprachreport/pdf/sr07-sonderheft.pdf)

  • KILGARRIFF, Adam. Googleology is Bad Science. In: Computational linguistics [online]. 2007, Jg. 33, Nr. 1, S. 147-151. ISSN 0891-2017.

        (http://www.kilgarriff.co.uk/Publications/ 2007-K-CL-Googleology.pdf)

  • www.korpus.cz – nové rozhraní KonText pro práci s korpusy ČNK

Sylabus
Poslední úprava: Mgr. Věra Hejhalová, Ph.D. (29.09.2018)

1.10.2018 Einleitungsstunde, Organisatorisches

Theorie

  • Korpus, seine Struktur, seine Zweckdienlichkeit, seine Arten, Geschichte, Allgemeines usw. 

Praktischer Teil

  • Korpusregistrierung, Basisorientierung im COSMAS II.

 

8.10.2018 – 2. Stunde

Theorie

  • Zusammensetzung der Korpora, Repräsentativität, Ausgewogenheit, Bearbeitung (tagging, tokenizace, desambiguace, parsing), Normativität usw.

 Praktischer Teil

  • Probe des Zugangs (eduroam, COSMAS II., COSMAS II – online, ČNK, InterCorp)
  • Suche in DeReKo, grundsätzliche Suchanfragen, ausgewählte Probleme
  • Sammlung eigener Ideen/Problemstellen bei Erstellung der Suchanfragen

 

 

15.10.2018 – 3. Stunde

Theorie

  • Mannheimer Korpora – Geschichte, Umfang, Zusammensetzung, Such- und Analysemöglichkeiten (DeReKo, COSMAS II.), AGD (Archiv für Gesprochenes Deutsch)

 Praktischer Teil

  • Anwendung: Suche in Mannheimer Korpora – kompliziertere Suchanfragen
  • Suchergebnisse auswerten

 

 

22.10.2018 – 4. Stunde

Theorie:

  • Internet als Korpus? Suchmöglichkeiten, Quellen, Vorteile, Nachteile, WaC

 Praktischer Teil

  • Suche in Mannheimer Korpora – kompliziertere Suchanfragen
  • Suchergebnisse auswerten
  • Vergleich mit den Suchmöglichkeiten in Google

 

29.10.2018 – 5. Stunde

Theorie

  • Český národní korpus - Geschichte, Umfang, Zusammensetzung, Such- und Analysemöglichkeiten; Diachrone Korpora; Korpora der gesprochenen Sprache – Ausnutzung, Umfang, Zweckdienlichkeit: (ohne InterCorp)

 Praktischer Teil

  • DeReKo-Reste
  • Such- und Analysemöglichkeiten in ČNK – KonText, T-Score, MI-Score

 

5.11.2018 – 6. Stunde

Theorie

  • Parallelkorpus InterCorp - Geschichte, Umfang, Zusammensetzung, Such- und Analysemöglichkeiten

Praktischer Teil

  • Such- und Analysemöglichkeiten in ČNK
  • Park, KonText

 

12.11.2018 – 7. Stunde

Theorie

  • Korpuslexikographie – Realität, Vision, corpus-based, -driven, elexiko, OWID, eVALBU, SYD, WordNet, DWDS, Ausnutzung der Korpora für Lexikographie – konkrete Möglichkeiten. 

 Praktischer Teil

  • Such- und Analysemöglichkeiten in DeReKo und ČNK
  • KonText
  • lexikographische Bearbeitung eines Stichwortes auf Grund der korpusbasierten und korpusanalytischen Anfragen + Vergleich mit bestehenden Wörterbüchern

 

19.11. 2018 – 8. Stunde

Theorie

  • Phraseologieforschung und Korpora (corpus-based/-driven; Kookkurrenzanalyse, CCDB, Kollokation, Kookkurrenz, Kolligation usw.)

 Praktischer Teil

  • Suche der komplizierten Wortverbindungen in DeReKo und ČNK

 

23.11.2018 – 9. Stunde

Theorie

  • Korpora für didaktische Zwecke

 Praktischer Teil

  • Kookkurrenzanalyse, CCDB – Suchen, Ergebnisse auswerten und verstehen

 

3.12.2018 – 10. Stunde

Praktischer Teil

  • ČNK, Filter, statistische Maße
  • Applikationen – SyD, Morfio, Treq

 

10.12.2018 – 11. Stunde

Praktischer Teil

  • ČNK, InterCorp

 

17.12.2018 – 12. Stunde

Praktischer Teil

  • DWDS
  • Reste

7.1.2019 – 13. Stunde

  • kurzer schriftlicher Test zur Theorie der Korpuslinguistik
  • praktisches Überprüfen der Such- und Analysefähigkeiten und Kenntnisse

Požadavky k zápisu
Poslední úprava: Mgr. Věra Hejhalová, Ph.D. (29.09.2018)

Předmět je určen pro studenty navazujícího magisterského studia. Pro studenty bakalářského studia je určen kurz Práce s korpusy, který je vypisován v LS.

 
Univerzita Karlova | Informační systém UK