PředmětyPředměty(verze: 901)
Předmět, akademický rok 2021/2022
  
Sociální sítě a jejich analýza - NAIL116
Anglický název: Social networks and their analysis
Zajišťuje: Katedra teoretické informatiky a matematické logiky (32-KTIML)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2020
Semestr: zimní
E-Kredity: 5
Rozsah, examinace: zimní s.:2/2 Z+Zk [hodiny/týden]
Počet míst: neomezen
Minimální obsazenost: neomezen
Virtuální mobilita / počet míst: ne
Stav předmětu: vyučován
Jazyk výuky: angličtina, čeština
Způsob výuky: prezenční
Garant: doc. RNDr. Iveta Mrázová, CSc.
RNDr. František Mráz, CSc.
Třída: Informatika Mgr. - Teoretická informatika
Kategorizace předmětu: Informatika > Informatika, Aplikační software, Počítačová grafika a geometrie, Databázové systémy, Didaktika informatiky, Diskrétní matematika, Předměty širšího základu, Předměty obecného základu, Počítačová a formální lingvistika, Optimalizace, Programování, Softwarové inženýrství, Teoretická informatika
Je neslučitelnost pro: NAIX116
Je záměnnost pro: NAIX116
Anotace -
Poslední úprava: RNDr. Jan Hric (07.05.2018)
Koncept sociálních sítí se používá pro modelování vzájemných vztahů mezi lidmi (ale i jinými objekty jako např. chemickými sloučeninami). Zajímavé problémy sahají od hledání důležitých strukturálních vzorů, které ovlivňují vzájemnou interakci jednotlivých aktérů v síti, přes analýzu sentimentu, která studuje názory, emoce a postoje lidí, až po analýzu a vývoj struktury sociální sítě samotné. Současné trendy směřují spíše k internetovým sociálním sítím, jako jsou např. Facebook, LinkedIn a MySpace. Ty totiž podporují mimořádně snadný sběr dat použitelných pro nejrůznější aplikace.
Cíl předmětu -
Poslední úprava: RNDr. Jan Hric (09.05.2018)

Přednáška má spíše přehledový charakter a jejím hlavním cílem je seznámit studenty se základními pojmy a algoritmy používanými v oblasti sociálních sítí. Součástí přednášky/cvičení bude návrh jednoduché aplikace umožňující hlubší pochopení problematiky sociálních sítí a přístupů vhodných pro jejich analýzu. Předpokládají se znalosti v rozsahu bakalářského kurzu NDBI025 Databázové systémy a zvládnutí jazyka Python alespoň na úrovni úvodního kurzu programování pro 1. ročník bakalářského studia.

Předmět je přednášen (pouze) v angličtině.

Podmínky zakončení předmětu -
Poslední úprava: RNDr. František Mráz, CSc. (02.10.2020)

A) Cvičení

V doprovodném Moodle-kurzu budou postupně zveřejňované úkoly a testy.

Úkoly:

Každý úkol má stanovené datum odevzdání. Řešení lze do systému vkládat postupně a průběžně ho upravovat. Časem odevzdání je čas kliknutí na tlačítko "Odevzdat úkol". Po kliknutí na toto tlačítko řešení už nelze opravovat, ale lze zažádat e-mailem učitele o vrácení do stavu rozpracovaný. Každý úkol bude učitelem oznámkován přidělením 0–10 bodů. Za celý semestr budou zadány 3 úkoly.

Typické řešení úkolu bude sestávat z textu — popisu řešení — a kódu programu/skriptu v Pythonu použitého na vyřešení úkolu. Texty odevzdávejte ve formátu PDF, případně RTF, zdrojové kódy jako jednoduché ASCII soubory.

Upozornění: V případě, že bude zjištěno, že N≥2 posluchačů odevzdalo řešení, která se nápadně podobají nebo jsou zcela totožná, budou všechna tato řešení považována za jedno řešení. Toto řešení bude ohodnoceno B body podle jeho kvality, ale každý z těchto N řešitelů získá pouze dolní celou část z B/N bodů.

Testy:

Kromě úkolů, budou postupně zveřejňovány on-line testy, za které bude možné získat dohromady maximálně 20 bodů. Každý test bude mít stanovené datum, do kterého musí být vyřešen. Řešit test po tomto datu nebude možné.

Pro získání zápočtu je nutné:

  1. Vypracovat řešení všech úkolů a za řešení každého úkolu získal alespoň 1 bod. POZOR: za pozdní odevzdání úkolu se strhává 1 bod za každý započatý týden po termínu odevzdání!
  2. Vypracovat a přednést řešení projektu na jednom z posledních cvičení nebo v termínu prezentací v zkouškovém období (jeho datum a čas bude dohodnutý na cvičení v posledním týdnu semestru). Témata projektů budou dohodnutá přibližně v půlce semestru na cvičení. Prezentace a odevzdané řešení budou taktéž ohodnoceny dohromady 0–15 body.

Řešení on-line testů není nutnou podmínkou pro získání zápočtu. Na cvičeních lze získat dodatečné body

  • za předvedení řešení úkolu zadaného na cvičení — 1 bod,
  • za předvedení řešení úkolu zadaného a odevzdaného v Moodlu (po termínu odevzdání) — dolní celá část poloviny bodů, které budou přiděleny za odevzdané řešení.

Bez dodatečných bodů tak lze za celý semestr získat až 65 bodů. Body získané za celý semestr budou zkoušejícím započítány do celkové známky za předmět tak, aby tvořily 40% výsledného bodového hodnocení, ze kterého bude odvozena známka při zkoušce. I když student získá z cvičení více než 65 bodů (po započítání dodatečných bodů), tak tyto budou započítány pouze jako 40% do hodnocení zkoušky.

Získání zápočtu vyžaduje průběžnou práci přes celý semestr, a proto žádné náhradní termíny pro získání zápočtu nebudou vypsány.

B) Přednáška

Přednáška se koná jednou týdně podle rozvrhu. Jak už bylo zmíněno výše, body získané z cvičení budou započítány s vahou 40% do celkového hodnocení posluchače. Dále se bude v rámci přednášky psát písemný test. Datum konání testu bude vypsáno na začátku semestru a bude zveřejněno v doprovodném Moodle kurzu. Písemný test přispěje 15% k celkovému hodnocení. Samotná zkouška na konci semestru se započítává 45% do výsledného hodnocení. Posluchač získá známku na základě celkového hodnocení podle následující tabulky

známka 1 známka 2 známka 3 nevyhověl
100%–86% 85%–71% 70%–56% méně než 56%

Literatura -
Poslední úprava: doc. RNDr. Iveta Mrázová, CSc. (27.05.2020)

  1. Charu C. Aggarwal (Ed.): Social Network Data Analytics, Springer, 2011
  2. Amy N. Langville, Carl D. Meyer: Google´s PageRank and Beyond: The Science of Search Engine Rankings, Princeton University Press, 2006
  3. Bing Liu: Sentiment Analysis: Mining Opinions, Sentiments, and Emotions, Cambridge University Press, 2015
  4. Albert-László Barabási: Network science. Cambridge university press, 2016

Požadavky ke zkoušce -
Poslední úprava: doc. RNDr. Iveta Mrázová, CSc. (27.05.2020)

Zkouška se skládá z písemné a ústní části. Písemná část předchází části ústní, její nesplnění znamená, že celá zkouška je hodnocena známkou nevyhověl(a) a ústní částí se již nepokračuje. Nesložení ústní části znamená, že při příštím termínu je nutno opakovat obě části zkoušky, písemnou i ústní. Známka ze zkoušky se stanoví na základě bodového hodnocení písemné i ústní části zkoušky a bodového hodnocení získaného za práci během semestru (viz podmínky zakončení předmětu).

Písemná část zkoušky bude sestávat ze tří otázek k tématům, která korespondují se sylabem přednášky a/nebo látce procvičované na cvičení.

Požadavky ke zkoušce odpovídají sylabu předmětu v rozsahu, který byl prezentován na přednášce, resp. cvičení. Nutnou podmínkou pro účast na zkoušce je získání zápočtu.

Sylabus -
Poslední úprava: RNDr. Jan Hric (07.05.2018)
  1. Úvod do problematiky:
    • Vyhledávání informací, prohledávání webu, analýza sociálních sítí
    • Aktuální výzkum v oblasti sociálních sítí a směr dalšího vývoje
  2. Základní paradigmata pro analýzu sociálních sítí:
    • Popis dat a modelů, předzpracování textu a webových stránek, modely pro grafová data, vlastnosti statických a dynamických grafů
    • Izomorfizmus podgrafů, problém největšího společného podgrafu
    • Zjišťování shody a výpočet vzdálenosti na grafech
    • Topologické deskriptory
    • Časté transformace založené na znalosti (pod)struktury a dobývání znalostí z grafů
    • Klastrování a klasifikace grafů
  3. Techniky pro dobývání znalostí z webu:
    • Web crawling a vyhledávání zdrojů
    • Indexování a zpracování dotazu ve vyhledávačích, ovlivňování výsledků vyhledávání
    • Řadicí algoritmy: PageRank a HITS
    • Doporučovací systémy: metody založené na obsahu, kolaborativní filtrování, grafové metody, klastrovací metody, modely založené na LSI
    • Dobývání znalostí o využívání webu: sběr dat a jejich předzpracování, zjišťování a analýza poznatků o způsobu využívání webu
  4. Přístupy pro analýzu sociálních sítí:
    • Úvod a základní vlastnosti, míry pro centralitu a prestiž
    • Vyhledávání komunit: algoritmus Kernighan-Lina a jeho analýza, klastrovací algoritmy, prolínající se komunity
    • Klasifikace uzlů a šíření jejich vlastností, analýza sociálního vlivu, detekce expertů v sociálních sítích
    • Evoluce a predikce linků v sociálních sítích
  5. Aplikace:
    • Analýza sentimentu
    • Zjišťování názoru: zjišťování názoru na základě příznaků a sumarizace, vyhledávání a spamování názorů
    • Dobývání znalostí z dat, textu a multimedií na sociálních sítích
    • Reklama na webu
 
Univerzita Karlova | Informační systém UK