Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 390)
Detail práce
   Přihlásit přes CAS
Optimalizace úředních dokumentů a databází pro vyhledávače (SEO pro vývěsky)
Název práce v češtině: Optimalizace úředních dokumentů a databází pro vyhledávače (SEO pro vývěsky)
Název v anglickém jazyce: Search Engine Optimization for Official Documents and Databases
Akademický rok vypsání: 2014/2015
Typ práce: projekt
Jazyk práce:
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. RNDr. Ondřej Bojar, Ph.D.
Řešitel:
Zásady pro vypracování
Státní správa stále záměrně či pro neschopnost produkuje nenalezitelné oficiální dokumenty (zákony, návrhy změn, vyhlášky, nařízení, rozhodnutí soudů atd.). Přitom jsou příslušné dokumenty často k dispozici na webu, jen důkladně skryty za nešikovně navrženými databázemi, tlačítky "Otevřít dokument" a v nevhodných formátech (PDF, MS Word).

Cílem projektu (ať už ročníkového nebo velkého) je navrhnout univerzální cache takových dokumentů a implementovat filtry pro několik konkrétních databází a několik základních formátů. Webarchive lze považovat za příklad takové cache, i když budované za jiným účelem.

Výsledná cache musí mít podobu webového serveru s jednoduchými URL (jen simulovaná adresářová struktura). Názvy adresářů je třeba zkusit vyrábět maximálně popisné, a případně alespoň jako krátké a perzistentní identifikátory. Jednotlivé stránky pak budou obsahovat jednak odkaz/postup, jak byl dokument získán, a jednak verzi v čistém HTML. Cílem je, aby internetové vyhledávače získaly přístup i do části Internetu skryté za neobratná technická řešení.

Téma lze rozvíjet o doplňky v rozsahu bakalářských i diplomových prací, např. automatický návrh popisných identifikátorů z dokumentu.
Seznam odborné literatury
http://en.wikipedia.org/wiki/Search_engine_optimization

Magistrát zveřejnil audit předražené Blanky. Na webu ho rafinovaně schoval.
http://web.volny.cz/noviny/z-domova/clanek/~volny/IDC/157216/
Příklad skrytého dokumentu, který je třeba nabídnout vyhledávačům.

Web Archive.
http://www.archive.org/
Pro ilustraci.
 
Univerzita Karlova | Informační systém UK