Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Dlouhodobé uchování webového obsahu
Thesis title in Czech: Dlouhodobé uchování webového obsahu
Thesis title in English: Long-term Preservation of Web Content
Key words: webová archivace; webový obsah; dlouhodobá archivace digitálních dokumentů; migrace; emulace; metadata; Národní knihovna České republiky
English key words: web archiving; web content; long-term preservation of digital information; migration; emulation; metadata; National Library of the Czech Republic
Academic year of topic announcement: 2012/2013
Thesis type: diploma thesis
Thesis language: čeština
Department: Institute of Information Studies and Librarianship - New Media Studies (21-UISKNM)
Supervisor: PhDr. Mgr. Jan Pokorný, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 24.10.2012
Date of assignment: 24.10.2012
Administrator's approval: not processed yet
Confirmed by Study dept. on: 26.11.2012
Date and time of defence: 14.09.2016 09:00
Date of electronic submission:28.07.2016
Date of proceeded defence: 14.09.2016
Submitted/finalized: committed by student and finalized
Opponents: Ing. Martin Souček, Ph.D.
 
 
 
Guidelines
Předběžná osnova
1. Úvod
2. Možnosti dlouhodobého uchování webového obsahu
3. Současné nástroje pro dlouhodobé uchování webového obsahu
4. Příklad z praxe. Ukládání obsahu z WebArchivu do LTP úložiště NK
5. Závěr
Ve své diplomové práci se chci zabývat problematikou dlouhodobého uchování webového obsahu. Obsah, který je tzv. born-digital a už je nějakým způsobem zpracovaný (např. sklizený národním web archivem) a vzniká u něj potřeba ho dlouhodobě uložit – v řádech desítek let. Cílem práce bude zpracovat otázky ohledně plánování dlouhodobé ochrany: na co je třeba se zaměřit (metadata, zastarávání formátů…), jaká rizika mohou nastat, jaké jsou možnosti ochrany. Dále se chci podrobně zabývat dvěma základními strategiemi pro dlouhodobé ukládání informací: emulací a migrací.
Další částí mé práce bude problematika infrastruktury – jaký hardware, nosiče je možné využít a jaké softwarové nástroje existují. Také se chci zabývat způsoby, kterými je možné dlouhodobě uchovat data z webu 2.0. Chci popsat specifika archivace takového webu, a proč nejde ukládat jako jiný web. Zaměřím se na to, jak je možné dlouhodobě ochránit blogy, wiki systémy nebo sociální sítě.
Poslední část práce bude konkrétní příklad z praxe. Popíši uložení obsahu z českého projektu WebArchiv, který sklízí český web, do nově budovaného LTP (long-term preservation) úložiště, které spadá pod Národní digitální knihovnu, kterou provozuje Národní knihovna České republiky spolu s Moravskou zemskou knihovnou v Brně a dalšími institucemi.
Diplomová práce bude připravena v souladu s platnými vnitřními předpisy FF UK a dalšími metodickými pokyny a normativními dokumenty.
References
CELBOVÁ, Ludmila et al. Archivace webu. 1. vyd. Praha: Národní knihovna ČR, 2008. 45 s. ISBN 978-80-7050-562-5.
CONWAY, Paul. Preservation in the Age of Google: Digitization, Digital Preservation, and Dilemmas. The library quarterly [online]. 2012, vol. 80, no. 1, s. 61-79. ISSN 0024-2519. Dostupné z: http://www.jstor.org/stable/10.1086/648463
CUBR, Ladislav. Dlouhodobá ochrana digitálních dokumentů. 1. vyd. Praha: Národní knihovna České republiky, 2010. 154 s. ISBN 978-80-7050-588-5.
MASANES, Julien. Web archiving. Berlin: Springer, c2006, vii, 234 s. ISBN 3540233385.
PAUL-CHOUDHURY, Sumit. Your digital legacy. New Scientist [online]. London: Reed Business Information, 2011, Vol. 210, Issue 2809, s. 40-43. ISSN 0262-4079. Dostupné z: http://search.ebscohost.com/login.aspx?direct=true&db=a9h&AN=61029194&lang=cs&site=ehost-live
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html