PředmětyPředměty(verze: 978)
Předmět, akademický rok 2025/2026
   
Analýza bibliografických literárních dat - ABO700672
Anglický název: Analysis of literary bibliographical data
Zajišťuje: Ústav české literatury a komparatistiky (21-UCLK)
Fakulta: Filozofická fakulta
Platnost: od 2025
Semestr: letní
Body: 4
E-Kredity: 4
Způsob provedení zkoušky: letní s.:
Rozsah, examinace: letní s.:0/2, Z [HT]
Počet míst: neurčen / neurčen (neurčen)
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Kompetence:  
Stav předmětu: nevyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Úroveň:  
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
Garant: Mgr. Vojtěch Malínek, Ph.D.
Rozvrh   Nástěnka   
Anotace
Kurz Analýza bibliografických literárních dat je koncipován jako výběrový seminář, jenž studenty seznámí s praktickými možnostmi analýzy bibliografických dat pro potřeby literární vědy v prostředí existujících online nástrojů, tabulkovém editoru (MS Excel) a pomocí předpřipravených softwarových skriptů (jazyk Python). Kurz je vhodný pro zájemce všech stupňů studia. Výhodou, nikoli nezbytnou podmínkou pak je předchozí zkušenost s prací s bibliografickými databázemi či zájem o analýzy literárních dat.
Poslední úprava: Malínek Vojtěch, Mgr., Ph.D. (03.02.2025)
Podmínky zakončení předmětu

  1. Účast na hodinách (max. 3 absence)

  2. Plnění průběžných úkolů. 

Poslední úprava: Malínek Vojtěch, Mgr., Ph.D. (03.02.2025)
Literatura

Bibliografické databáze:

Česká literární bibliografie: https://clb.ucl.cas.cz

Databáze Národní knihovny ČR: https://aleph.nkp.cz/ 

 

Standardy datového popisu:

MARC 21 Bibliographic Data: https://www.loc.gov/marc/bibliographic/

 

 

Výběrová literatura předmětu:

LAHTI, Leo — MARJANEN, Jani — ROIVAINEN, Hege — TOLONEN, Mikko. Bibliographic Data Science and the History of the Book (c. 1500–1800). Cataloging & Classification Quarterly 57, č. 1, 2019, s. 5–23. DOI: https://doi.org/10.1080/01639374.2018.1543747 

MALÍNEK, Vojtěch — HARTMANOVÁ, Pavla. Bibliografické databáze jako pramen pro datovou analýzu. Potenciál a limity České literární bibliografie pro kvantitativní výzkum. Střed 13, č. 1, 2021, s. 50–81.

MALÍNEK, Vojtěch. Možnosti využití bibliografických datasetů jako zdrojů pro kvantitativní výzkum v humanitních vědách. Případ České literární bibliografie”. In: Hladík, R. (ed.), Digitální obrat v českých humanitních a sociálních vědách. Praha: Karolinum, 2022, s. 19–44.

MALÍNEK, Vojtěch. Oborová analytická bibliografie: metodika zpracování. Praha: Ústav pro českou literaturu AV ČR, 2020.

TOLONEN, Mikko  — VIMR, Ondřej  — KIRÁLY, Péter  — PANUŠKOVÁ, Charlotte (2023): Bibliographical Data Science: from Catalogues to Research Data. Version 1.0 Retrieved Nov 13, 2023. Dostupné z: https://marketplace.sshopencloud.eu/workflow/tE2HiC

VIMR, Ondřej – ROSIŃSKI, Cezary. Česká literatura ve světě: možnosti mapování ve velkém rozsahu (1820–2020). Česká literatura 70, č. 6, 2022, s. 711–734. DOI: https://doi.org/10.51305/cl.2022.06.03 

VIMR, Ondřej. A computational approach to the history of Czech literature in translation during the Cold War (1948-1989). Translation Studies. 2024. DOI: https://doi.org/10.1080/14781700.2024.2421550 

Poslední úprava: Malínek Vojtěch, Mgr., Ph.D. (03.02.2025)
Sylabus

Cílem semestrálního kurzu je seznámit studenty s metodami digital humanities na podkladě bibliografických databází  České literární bibliografie. Kromě efektivní práce s článkovou databází při vytváření rešerší a osobních či časopiseckých bibliografií se studenti naučí aplikovat kvantitativní metody výzkumu nejen na obecnou reflexi literatury a literárního dění, ale i na vybraná dílčí témata (knižní trh, literární sociologie, literární transfer na příkladu cirkulace překladových děl) . Studenti se seznámí s mezinárodním bibliografickým formátem MARC21, získají povědomí o tzv. propojených datech (linked data). Významná část kurzu bude věnována osvojení základů programovacího jazyka Python. Studenti budou vedeni k tomu, aby si informace pomocí daných nástrojů byli schopni sami extrahovat, upravit a prezentovat je (tvorba grafů a tabulek). K tomu budou v rámci kurzu využívány tabulkové procesory (MS Excel), ale i volně dostupné softwarové nástroje (Python v prostředí Google Colab).

 

Kurz bude rozdělen do následujících tematických bloků:

  1. Bibliografická data a úvod do MARC21

  2. Databáze České literární bibliografie (historie / struktura databází / vyhledávání/ tvorba rešerší)

  3. Základy programovacího jazyka Python

  4. Příprava dat pomocí jazyka Python

  5. Čištění a úprava dat v tabulkových procesorech

  6. Tvorba grafů v tabulkových procesorech

  7. Úvod do tzv. propojených dat (linked data) a autoritních databází

  8. Komputační analýza a vizualizace dat pomocí jazyka Python

 

V průběhu kurzu budou studenti dostávat drobné praktické úkoly, aby si osvojili funkce rozmanitých nástrojů pro práci s literárními daty.

Poslední úprava: Malínek Vojtěch, Mgr., Ph.D. (03.02.2025)
Vstupní požadavky

Výuka předmětu předpokládá práci s vlastním počítačem během hodiny. Nepředpokládají se žádné předchozí znalosti programovacího jazyka Python. Elementární znalost práce s MS Excel je dílčí výhodou, nikoli však nezbytností.

Poslední úprava: Malínek Vojtěch, Mgr., Ph.D. (03.02.2025)
 
Univerzita Karlova | Informační systém UK