PředmětyPředměty(verze: 945)
Předmět, akademický rok 2020/2021
   Přihlásit přes CAS
Digitální žurnalistika a datová analýza - JJM300
Anglický název: Digital Journalism and Data Analysis
Český název: Digitální žurnalistika a datová analýza
Zajišťuje: Katedra žurnalistiky (23-KZ)
Fakulta: Fakulta sociálních věd
Platnost: od 2020 do 2020
Semestr: oba
E-Kredity: 4
Rozsah, examinace: 0/2, KZ [HT]
Počet míst: zimní:neurčen / 20 (20)
letní:neurčen / neurčen (20)
Minimální obsazenost: 10
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Poznámka: při zápisu přednost, je-li ve stud. plánu
předmět lze zapsat v ZS i LS
Garant: PhDr. Václav Moravec, Ph.D., Ph.D.
Vyučující: PhDr. Václav Moravec, Ph.D., Ph.D.
Termíny zkoušek   Rozvrh   Nástěnka   
Anotace
Poslední úprava: PhDr. Václav Moravec, Ph.D., Ph.D. (15.10.2020)
► Stručná charakteristika předmětu:
Cílem volitelného semináře, jehož odborným garantem je Středisko žurnalistiky umělé inteligence při IKSŽ FSV UK, je seznámit studentky a studenty s problematikou datové analýzy, včetně jejího následného zpracování do žurnalistických obsahů. Seminář se skrze případové studie zaměřuje na problematiku přístupu k datům (tzn. způsoby stahování, příklady veřejně dostupných dat v českém prostředí apod.), dále na zpracovávání dat, dostupné nástroje a interpretaci (tzn. nejčastější chyby v interpretaci u žurnalistů, špatné příklady z médií). Závěrečnou částí semináře je praktický workshop na příkladu datových zdrojů z Národního katalogu otevřených zdrojů. Účastníci semináře budou rozděleni do redakčních týmů, v nichž se naučí identifikovat klíčová témata a osobnosti sociálních sítí, datovou analýzu, správnou vizualizaci dat, včetně možných úskalí. Výstupy workshopu budou publikovány na webových stránkách Střediska žurnalistiky umělé inteligence.
► Jména vyučujících: Václav Moravec, Veronika Halámková
► Rozsah výuky: 0/2 ZS
► Podmínky zapsání předmětu: přijetí do magisterského studia
► Podmínky pro úspěšné zakončení semináře: 1) aktivní účast v semináři doplněná studiem povinné i doporučené literatury, ověřováno průběžně (40% z celkového hodnocení), 2) zpracování předmětné datové analýzy do publikovatelného textu na webových stránkách Střediska žurnalistiky umělé inteligence (60% z celkového hodnocení). Nesplnění jedné ze dvou výše uvedených podmínek znamená neúspěšné ukončení předmětu.
► Počet kreditů: 4
Cíl předmětu
Poslední úprava: PhDr. Václav Moravec, Ph.D., Ph.D. (15.10.2020)

Cílem volitelného semináře, jehož odborným garantem je Středisko žurnalistiky umělé inteligence při IKSŽ FSV UK, je seznámit studentky a studenty s problematikou datové analýzy, včetně jejího následného zpracování do žurnalistických obsahů. Seminář se skrze případové studie zaměřuje na problematiku přístupu k datům (tzn. způsoby stahování, příklady veřejně dostupných dat v českém prostředí apod.), dále na zpracovávání dat, dostupné nástroje a interpretaci (tzn. nejčastější chyby v interpretaci u žurnalistů, špatné příklady z médií). Závěrečnou částí semináře je praktický workshop na příkladu datových zdrojů z Národního katalogu otevřených zdrojů. Účastníci semináře budou rozděleni do redakčních týmů, v nichž se naučí identifikovat klíčová témata a osobnosti sociálních sítí, datovou analýzu, správnou vizualizaci dat, včetně možných úskalí. Výstupy workshopu budou publikovány na webových stránkách Střediska žurnalistiky umělé inteligence.

Podmínky zakončení předmětu
Poslední úprava: PhDr. Václav Moravec, Ph.D., Ph.D. (15.10.2020)

1) aktivní účast v semináři doplněná studiem povinné i doporučené literatury, ověřováno průběžně (40% z celkového hodnocení), 2) zpracování předmětné datové analýzy do publikovatelného textu na webových stránkách Střediska žurnalistiky umělé inteligence (60% z celkového hodnocení). Nesplnění jedné ze dvou výše uvedených podmínek znamená neúspěšné ukončení předmětu.

Literatura
Sylabus
Poslední úprava: PhDr. Václav Moravec, Ph.D., Ph.D. (15.10.2020)

Uvedení do problematiky semináře (první třetina semestru)

  • Přístup k datům

    • Způsoby stahování

    • Veřejně dostupná data v českém prostředí - příklady

  • Zpracovávání dat, dostupné nástroje a interpretace

  • Nejčastější chyby v interpretaci u žurnalistů, špatné příklady z médií

 

Praktický workshop na příkladu datových zdrojů Socialbakers* (dvě třetiny semestru)

  • Jak visualizovat data (a jak ne).

  • Co můžeme říct o lidech, kteří sledují (mentionují) profil na Twitteru? Příklad na politice a médiích.

  • Identifikace klíčových lidí v síti.

 

* Datové zdroje se sestávají z veřejně měřitelného obsahu sociálních sítí prostřednictvím developerského rozhraní (APIs). Primárně se v datech určených pro mediální komunikaci společnost Socialbakers zaměřuje na následující platformy: Facebook, Twitter, Instagram, Youtube. Veřejně měřitelný obsah může být například velikost fanouškovské základy, aktivita stránek a angažovanost jejich publika.

 

Datové zdroje ke zpracování do médií

Poskytnutí několika datových zdrojů k aktuálnímu tématu nebo využití veřejně dostupných datových zdrojů, konzultace výsledků (především statistického zpracování datové analýzy a interpretací výsledků).

Presence of Czech media (newspaper, online news) on Facebook and/or Twitter

Focus:keyword analysis, affinities of followers, overall activity (shareability, sentiment, most shared articles via social), differences between platforms (Twitter tends to use specific group of users in CZ)
Platforms:Facebook and Twitter

Datasets:

1) Facebook posts

  1. a)  Fields: created time, message, total interactions, attachment, external link, post

    link, reactions, sentiment, post type

  2. b)  Time range: 2019

  3. c)  Scope: posts of max 8 selected media (example: idnes, ihned, lidovky, novinky,

    aktualne)

  4. d)  Security: public data from SBKS database

posts

  1. 2)  Twitter

    1. a)  Fields: created time, message, total interactions, mentions, hashtags,

      attachment, external link, tweet link, sentiment, post type

    2. b)  Time range: 2019

    3. c)  Scope: posts of max 8 selected media (example: idnes, ihned, lidovky, novinky,

      aktualne)

    4. d)  Security: public data from SBKS database

  2. 3)  Media followers

    1. a)  Fields: follower id, following ids, following names, following handles, following

      sbks tags

    2. b)  Scope: List of following for random Czech 1000 followers of max 8 media

    3. c)  Security: public data from Twitter proxy, tags from SBKS database

US Election/Politics

Focus: analysis of potential presidential candidates, affinities of followers, followers overlap, mentions in media... with the goal to select the most probable opponent to Donald Trump in 2020 election.
Platforms: Twitter

Datasets:

1) Followers of selected candidates (max 20)

  1. a)  Fields: profile id, followers ids

  2. b)  Scope: List of followers (ids) for selected profiles

  3. c)  Security: public data from Twitter proxy

  1. 2)  Twitter posts by selected US media that include mentions (or name) of selected candidates (max 20)

    1. a)  Fields: created time, message, mentions, hashtags, sentiment

    2. b)  Time range: 2019

    3. c)  Security: public data from SBKS database

  2. 3)  Political affinities

    1. a)  Fields: follower id, following ids, following names, following handles, following

      sbks tags

    2. b)  Scope: List of following for random US 5000 followers of max 8 selected

      politicians/parties

    3. c)  Security: public data from Twitter proxy, tags from SBKS database

  3. 4)  Replies to tweets and mentions of selected democr. party candidates by other candidates (max 10)

    1. a)  Time range: 2019

    2. b)  Scope: posts of max 10 selected politicians

    3. c)  Fields: mentions, message, sentiment, name

    4. d)  Security: public data from SBKS database

Czech Politics

Focus:keywords analysis, affinities, followers overlap, overall activity (shareability, sentiment), connectivity across parties (politicians from the same party)
Platforms:Facebook and Twitter
Datasets:

  1. 1)  Followers of selected Politicians / Parties (max 20)

    1. a)  Fields: profile id, followers ids

    2. b)  Scope: List of followers (ids) for selected profiles

    3. c)  Security: public data from Twitter proxy

  2. 2)  Facebook posts

    1. a)  Fields: created time, message, total interactions, attachment, external link, post

      link, reactions, sentiment, post type

    2. b)  Time range: 2019

    3. c)  Scope: posts of max 8 selected politicians/parties (example: Dominik Feri, ČSSD,

      Piráti, Andrej Babiš, SPD)

    4. d)  Security: public data from SBKS database

3) Twitter

  1. a)  Fields: created time, message, total interactions, mentions, hashtags,

    attachment, external link, tweet link, sentiment, post type

  2. b)  Time range: 2019

  3. c)  Scope: posts of max 8 selected politicians/parties (example: Dominik Feri, ČSSD,

    Piráti, Andrej Babiš, SPD)

posts

d) Security: public data from SBKS database

  1. 4)  Twitter

    1. a)  Fields: created time, message, mentions, hashtags, sentiment

    2. b)  Time range: 2018-2019

    3. c)  Scope: mentions of max 8 selected politicians/parties (example: Dominik Feri,

      ČSSD, Piráti, Andrej Babiš, SPD)

    4. d)  Security: public data from SBKS database

  2. 5)  Political affinities

    1. a)  Fields: follower id, following ids, following names, following handles, following

      sbks tags

    2. b)  Scope: List of following for random Czech 1000 followers of max 8 selected

      politicians/parties

    3. c)  Security: public data from Twitter proxy, tags from SBKS database

Other Topics

If anything interesting, worth data analysis occurs during autumn, we're open to include datasets and topics related to that. (max. 2 additional topics)

 
Univerzita Karlova | Informační systém UK