ARCLib, komplexní řešení pro dlouhodobou archivaci digitálních (knihovních) sbírek

Rozbor stavu řešení problému v ČR a zahraničí

V České republice již od druhé poloviny 90. let probíhá digitalizace a zpřístupňování knihovních dokumentů v digitální podobě. Mezi nejaktivnější patřily od počátku Národní knihovna, Moravská zemská knihovna, Knihovna Akademie věd a některé vysokoškolské knihovny (např. na Masarykově univerzitě)[1]. V posledních letech se tato aktivita významně zvýšila také v krajských knihovnách díky dotacím z evropských fondů. Dlouhodobá ochrana digitálních dokumentů je přímo řešena pouze v projektu Národní digitální knihovna (NDK) [2], ve kterém používá Národní knihovna ČR společně s Moravskou zemskou knihovnou v Brně pro dlouhodobou archivaci komerční systém. V ostatních knihovnách není v současné době žádné archivační řešení implementováno. V Knihovně AV ČR je vyvíjeno řešení pro produkci digitálních dokumentů ProArc, které bude současně zajišťovat určité archivační funkce (vytvoření SIP balíčku pro vložení do archivačního systému) nebude však k dispozici řešení plně pokrývající všechny části standardu pro archivaci dle referenčního modelu OAIS. Knihovny v České republice mají k dispozici standardy pro archivaci ČSN ISO 14721 a ČSN ISO 16363, chybí však jasná prováděcí metodika s ohledem na české prostředí a v něm používané systémy a formáty. Současně nejsou k dispozici snadno dostupná ucelená řešení pro archivaci, jakým je v případě zpřístupnění například open source systém Kramerius. Za velkou výhodu z hlediska výchozích podmínek dlouhodobé archivace lze považovat existenci standardního formátu NDK, který je při vytváření digitálních dokumentů následován ve všech významných digitalizačních projektech i v projektech menšího rozsahu. Standardní balíček NDK je založen na v současnosti obvyklých a doporučovaných formátech metadat (METS, PREMIS, MODS, Dublin Core, MIX a ALTO XML), které vycházejí zejména ze standardů doporučovaných Kongresovou knihovnou a jsou respektovány na mezinárodní úrovni. Základní předpoklady pro dlouhodobou archivaci jsou použitím tohoto standardu zajištěny, stejně tak i možnost sdílení dat mezi jednotlivými digitálními repozitáři vede ke zlepšení podmínek ochrany digitálních dokumentů. Standard NDK je určen pro digitalizované dokumenty a je potřeba pracovat na jeho rozšíření i pro e-born (digital born) dokumenty.

Národní knihovna České republiky v současné době využívá v rámci projektu Národní digitální knihovny pro dlouhodobou archivaci na míru vyvinuté komerční řešení. To slouží zejména pro dokumenty digitalizované Národní knihovnou a neposkytuje obecné řešení pro celou komunitu. Řada dalších dokumentů digitalizovaných v krajských a specializovaných odborných knihovnách se do archivačního řešení Národní knihovny nedostává a odpovědnost za jejich dlouhodobou archivaci zůstává na jednotlivých knihovnách. Všechny knihovny, které ukládají digitální a digitalizovaná data, by měly mít k dispozici volně dostupné softwarové řešení, které jim umožní data ochránit v souladu s požadavky normy OAIS. Archivační řešení v Národní knihovně je v současné době také omezeno několika faktory organizačního i technického rázu. I přesto, že současný vývoj směřuje k odstranění těchto omezení, stále není vyřešen postup (a neexistuje ani návrh jeho řešení) v případě ukončení činnosti úložiště NK ČR tak, jak si žádá norma ČSN ISO 16363 [3]. Z tohoto pohledu řešení ArcLib představuje cestu, jak může NK ČR naplnit požadavek standardů na existenci exit strategie.

V mezinárodním měřítku se setkáváme s různým přístupem k dlouhodobé archivaci digitálních dokumentů, využívána jsou komerční i volně dostupná řešení. V některých zemích probíhá koordinace na národních úrovních, jinde knihovny spolupracují s akademickou sférou při sdílení znalostí a podpoře výzkumu pro řešení dlouhodobé archivace [4].

Z volně dostupných systémů je pro řešení dlouhodobé archivace nejčastěji využíván systém Archivematica, jehož vývoj je veden kanadskou společností Artefactual Systems Inc. Archivematica je vyvíjena v souladu s ISO standardem OAIS (ČSN ISO 14721), neřeší však všechny funkční entity tohoto modelu [5]. Zaměřuje se jen na kritické archivační funkce (transfer, příjem, tvorba informačních balíčků SIP/AIP/DIP). Pro splnění všech parametrů vyžadovaných standardem je potřeba dalšího vývoje. Celé archivační řešení může být složeno z částí vzájemně plnících určité požadavky standardu, přičemž komplexně budou zajišťovat všechny funkce, tak jak je to plánováno v projektu, jehož výstupem bude archivační řešení ARCLib zastřešující a propojující jednotlivé komponenty.

Citace odborné literatury:

[1] MELICHAR, Marek; HUTAŘ, Jan. České paměťové instituce a digitální data – historický exkurz, současný stav a předpokládaný vývoj I. Duha [online]. 2013, roč. 27, č. 4 [cit. 2015-04-22]. Dostupný z WWW: <http://duha.mzk.cz/clanky/ceske-pametove-instituce-digitalni-data-historicky-exkurz-soucasny-stav-predpokladany-vyvoj>. ISSN 1804-4255.

[2] LTP SAFE. LTP SAFE [online]. 2009 [cit. 2015-04-22]. Dostupné z: http://www.aipsafe.cz/cs/for-public-sector/ltp

[3] Systémy pro přenos dat a informací z kosmického prostoru – Audit a certifikace důvěryhodných digitálních úložišť: Space data and information transfer systems – Audit and certification of trustworthy digital repositories = Systèmes de transfert des informations et données spatiales – Audit et certification des référentiels numériques de confiance : ČSN ISO 16363 : schváleno v září 2011 ve Washingtonu, DC, USA. 1. vyd. Praha: Úřad pro technickou normalizaci, metrologii a státní zkušebnictví, 2014, 53 s.

[4] MELICHAR, Marek; HUTAŘ, Jan. České paměťové instituce a digitální data – historický exkurz, současný stav a předpokládaný vývoj III.. Duha [online]. 2014, roč. 28, č. 2 [cit. 2015-04-22]. Dostupný z WWW: <http://duha.mzk.cz/clanky/ceske-pametove-instituce-digitalni-data-historicky-exkurz-soucasny-stav-predpokladany-vyvoj-1>. ISSN 1804-4255.

[5] UML Activity Diagrams. Archivematica [online]. 2011 [cit. 2015-04-22]. Dostupné z: https://www.archivematica.org/wiki/UML_Activity_Diagrams