Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Dlouhodobé uchování webového obsahu
Název práce v češtině: Dlouhodobé uchování webového obsahu
Název v anglickém jazyce: Long-term Preservation of Web Content
Klíčová slova: webová archivace; webový obsah; dlouhodobá archivace digitálních dokumentů; migrace; emulace; metadata; Národní knihovna České republiky
Klíčová slova anglicky: web archiving; web content; long-term preservation of digital information; migration; emulation; metadata; National Library of the Czech Republic
Akademický rok vypsání: 2012/2013
Typ práce: diplomová práce
Jazyk práce: čeština
Ústav: Ústav informačních studií - studia nových médií (21-UISKNM)
Vedoucí / školitel: PhDr. Mgr. Jan Pokorný, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 24.10.2012
Datum zadání: 24.10.2012
Schválení administrátorem: zatím neschvalováno
Datum potvrzení stud. oddělením: 26.11.2012
Datum a čas obhajoby: 14.09.2016 09:00
Datum odevzdání elektronické podoby:28.07.2016
Datum proběhlé obhajoby: 14.09.2016
Odevzdaná/finalizovaná: odevzdaná studentem a finalizovaná
Oponenti: Ing. Martin Souček, Ph.D.
 
 
 
Zásady pro vypracování
Předběžná osnova
1. Úvod
2. Možnosti dlouhodobého uchování webového obsahu
3. Současné nástroje pro dlouhodobé uchování webového obsahu
4. Příklad z praxe. Ukládání obsahu z WebArchivu do LTP úložiště NK
5. Závěr
Ve své diplomové práci se chci zabývat problematikou dlouhodobého uchování webového obsahu. Obsah, který je tzv. born-digital a už je nějakým způsobem zpracovaný (např. sklizený národním web archivem) a vzniká u něj potřeba ho dlouhodobě uložit – v řádech desítek let. Cílem práce bude zpracovat otázky ohledně plánování dlouhodobé ochrany: na co je třeba se zaměřit (metadata, zastarávání formátů…), jaká rizika mohou nastat, jaké jsou možnosti ochrany. Dále se chci podrobně zabývat dvěma základními strategiemi pro dlouhodobé ukládání informací: emulací a migrací.
Další částí mé práce bude problematika infrastruktury – jaký hardware, nosiče je možné využít a jaké softwarové nástroje existují. Také se chci zabývat způsoby, kterými je možné dlouhodobě uchovat data z webu 2.0. Chci popsat specifika archivace takového webu, a proč nejde ukládat jako jiný web. Zaměřím se na to, jak je možné dlouhodobě ochránit blogy, wiki systémy nebo sociální sítě.
Poslední část práce bude konkrétní příklad z praxe. Popíši uložení obsahu z českého projektu WebArchiv, který sklízí český web, do nově budovaného LTP (long-term preservation) úložiště, které spadá pod Národní digitální knihovnu, kterou provozuje Národní knihovna České republiky spolu s Moravskou zemskou knihovnou v Brně a dalšími institucemi.
Diplomová práce bude připravena v souladu s platnými vnitřními předpisy FF UK a dalšími metodickými pokyny a normativními dokumenty.
Seznam odborné literatury
CELBOVÁ, Ludmila et al. Archivace webu. 1. vyd. Praha: Národní knihovna ČR, 2008. 45 s. ISBN 978-80-7050-562-5.
CONWAY, Paul. Preservation in the Age of Google: Digitization, Digital Preservation, and Dilemmas. The library quarterly [online]. 2012, vol. 80, no. 1, s. 61-79. ISSN 0024-2519. Dostupné z: http://www.jstor.org/stable/10.1086/648463
CUBR, Ladislav. Dlouhodobá ochrana digitálních dokumentů. 1. vyd. Praha: Národní knihovna České republiky, 2010. 154 s. ISBN 978-80-7050-588-5.
MASANES, Julien. Web archiving. Berlin: Springer, c2006, vii, 234 s. ISBN 3540233385.
PAUL-CHOUDHURY, Sumit. Your digital legacy. New Scientist [online]. London: Reed Business Information, 2011, Vol. 210, Issue 2809, s. 40-43. ISSN 0262-4079. Dostupné z: http://search.ebscohost.com/login.aspx?direct=true&db=a9h&AN=61029194&lang=cs&site=ehost-live
 
Univerzita Karlova | Informační systém UK