Dlouhodobé uchování webového obsahu
Název práce v češtině: | Dlouhodobé uchování webového obsahu |
---|---|
Název v anglickém jazyce: | Long-term Preservation of Web Content |
Klíčová slova: | webová archivace; webový obsah; dlouhodobá archivace digitálních dokumentů; migrace; emulace; metadata; Národní knihovna České republiky |
Klíčová slova anglicky: | web archiving; web content; long-term preservation of digital information; migration; emulation; metadata; National Library of the Czech Republic |
Akademický rok vypsání: | 2012/2013 |
Typ práce: | diplomová práce |
Jazyk práce: | čeština |
Ústav: | Ústav informačních studií - studia nových médií (21-UISKNM) |
Vedoucí / školitel: | PhDr. Mgr. Jan Pokorný, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 24.10.2012 |
Datum zadání: | 24.10.2012 |
Schválení administrátorem: | zatím neschvalováno |
Datum potvrzení stud. oddělením: | 26.11.2012 |
Datum a čas obhajoby: | 14.09.2016 09:00 |
Datum odevzdání elektronické podoby: | 28.07.2016 |
Datum proběhlé obhajoby: | 14.09.2016 |
Odevzdaná/finalizovaná: | odevzdaná studentem a finalizovaná |
Oponenti: | Ing. Martin Souček, Ph.D. |
Zásady pro vypracování |
Předběžná osnova 1. Úvod 2. Možnosti dlouhodobého uchování webového obsahu 3. Současné nástroje pro dlouhodobé uchování webového obsahu 4. Příklad z praxe. Ukládání obsahu z WebArchivu do LTP úložiště NK 5. Závěr Ve své diplomové práci se chci zabývat problematikou dlouhodobého uchování webového obsahu. Obsah, který je tzv. born-digital a už je nějakým způsobem zpracovaný (např. sklizený národním web archivem) a vzniká u něj potřeba ho dlouhodobě uložit – v řádech desítek let. Cílem práce bude zpracovat otázky ohledně plánování dlouhodobé ochrany: na co je třeba se zaměřit (metadata, zastarávání formátů…), jaká rizika mohou nastat, jaké jsou možnosti ochrany. Dále se chci podrobně zabývat dvěma základními strategiemi pro dlouhodobé ukládání informací: emulací a migrací. Další částí mé práce bude problematika infrastruktury – jaký hardware, nosiče je možné využít a jaké softwarové nástroje existují. Také se chci zabývat způsoby, kterými je možné dlouhodobě uchovat data z webu 2.0. Chci popsat specifika archivace takového webu, a proč nejde ukládat jako jiný web. Zaměřím se na to, jak je možné dlouhodobě ochránit blogy, wiki systémy nebo sociální sítě. Poslední část práce bude konkrétní příklad z praxe. Popíši uložení obsahu z českého projektu WebArchiv, který sklízí český web, do nově budovaného LTP (long-term preservation) úložiště, které spadá pod Národní digitální knihovnu, kterou provozuje Národní knihovna České republiky spolu s Moravskou zemskou knihovnou v Brně a dalšími institucemi. Diplomová práce bude připravena v souladu s platnými vnitřními předpisy FF UK a dalšími metodickými pokyny a normativními dokumenty. |
Seznam odborné literatury |
CELBOVÁ, Ludmila et al. Archivace webu. 1. vyd. Praha: Národní knihovna ČR, 2008. 45 s. ISBN 978-80-7050-562-5. CONWAY, Paul. Preservation in the Age of Google: Digitization, Digital Preservation, and Dilemmas. The library quarterly [online]. 2012, vol. 80, no. 1, s. 61-79. ISSN 0024-2519. Dostupné z: http://www.jstor.org/stable/10.1086/648463 CUBR, Ladislav. Dlouhodobá ochrana digitálních dokumentů. 1. vyd. Praha: Národní knihovna České republiky, 2010. 154 s. ISBN 978-80-7050-588-5. MASANES, Julien. Web archiving. Berlin: Springer, c2006, vii, 234 s. ISBN 3540233385. PAUL-CHOUDHURY, Sumit. Your digital legacy. New Scientist [online]. London: Reed Business Information, 2011, Vol. 210, Issue 2809, s. 40-43. ISSN 0262-4079. Dostupné z: http://search.ebscohost.com/login.aspx?direct=true&db=a9h&AN=61029194&lang=cs&site=ehost-live |