ARCLib, komplexní řešení pro dlouhodobou archivaci digitálních (knihovních) sbírek

Metodika řešení problému

Vývoj komplexního LTP (Long Tem Preservation) open source řešení ARCLib s využitím open source systému Archivematica

Základní vstupní požadavky budou definovány zejména nově vytvořenými metodikami pro logickou i bitovou ochranu dat, které budou vycházet z relevantních ISO standardů. Projektový tým bude sledovat mezinárodní vývoj v oblasti dlouhodobé archivace a nové poznatky bude v rámci projektu aplikovat.

Při řešení projektu budou využity znalosti expertů v jednotlivých týmech získané při vývoji a testování systémů, které budou jako součást archivačního řešení ARCLib využity.

Několik členů řešitelského týmu bylo zapojeno do důkladného testování archivačního open source systému Archivematica (projekt s dotací od CESNETu 2014-2015). Na základě tohoto testování je možné identifikovat funkce Archivematiky, které bude možné plně využít a zároveň určit jaké části bude potřeba vytvořit. Při vývoji bude důležité sledovat záměry vývojového týmu Archivematiky a reagovat na ně při její integraci do řešení ARCLib.

V rámci celého řešení bude Archivematica zastávat především to, co je její hlavní funkčností, tedy zajištění kritických archivačních funkcí.

Členové řešitelského týmu mají zkušenosti s pokročilou implementací systému DSpace (MUNI – např. projekt DML.CZ) a vývoji a administraci systémů Kramerius (KNAV, NK, MZK) a ProArc (KNAV), což zajistí integraci těchto open source systémů (nebo jejich výstupů) do řešení ARCLib. Ze systému DSpace a Kramerius budou získána data, z kterých bude následně vytvořen SIP balíček. Produkční systém ProArc bude schopen požadovaný SIP balíček vytvořit v rámci svých exportních formátů. ProArc bude zároveň upravován tak, aby reagoval na aktualizace standardu NDK a aby dle potřeby umožnil vytvářet popis dalších typů dokumentů a materiálů uchovávaných v knihovnách (např. hudebniny a zvukové materiály).

Budou definovány a vytvořeny DIP balíčky, které bude ARCLib z Archivematiky schopen předávat zpět do systémů DSpace, Kramerius i ProArc. Součástí projektového týmu jsou odborníci na metadatové formáty, kteří zajistí potřebnou definici informačních balíčků včetně definice výměnného informačního balíčku, který bude sloužit ke sdílení dat mezi jednotlivými instancemi systému ARCLib a archivačním řešením v Národní knihovně ČR.

Bude zajištěn vstup dat do archivačního procesu bez ohledu na systém, v kterém byla data původně pořízena nebo uchovávána, ale pouze s ohledem na dodržení určitého minimálního standardu těchto dat.

V průběhu projektu bude zahájena spolupráce i s uživateli systému Invenio a bude se řešit možnost archivace dat z tohoto repozitáře používaného v současnosti pro Národní úložiště šedé literatury.

Vytvoření metodiky pro dlouhodobou logickou ochranu digitálních dat pro české prostředí s ohledem na mezinárodní standardy (zejména referenční model OAIS – ČSN ISO 14721 a ČSN ISO 16363)

Vytvoření metodiky budou v rámci řešitelského týmu v souladu s platnými standardy připravovat experti, kteří se dlouhodobě zabývají problematikou dlouhodobé archivace, vykazují v tomto směru odbornou publikační činnost a sledují mezinárodní vývoj. V současné době stojí tito experti např. také za přípravou návrhu Národní koncepce dlouhodobé ochrany dat pro knihovny, kterou již vzala na vědomí Ústřední knihovnická rada MK ČR.

Vytvoření metodiky a návrh řešení pro fyzické ukládání velkého množství dat a zajištění bit-level ochrany pro potřeby dlouhodobé archivace

Vytvoření metodiky budou v rámci řešitelského týmu v souladu a s využitím platných mezinárodních standardů a doporučených postupů (např. ISO 27000, ITIL) připravovat experti, kteří se zabývají fyzickým ukládáním velkého množství dat v rámci infrastruktury datových úložišť CESNETu a v současné době také spolupracují na projektu LTP-pilot.

Ověření v praxi formou poloprovozu

Vyvíjené řešení bude průběžně testováno na infrastruktuře řešitelských institucí. Před dokončením projektu dojde k nasazení v Knihovně AV ČR na ostrých datech s cílem dlouhodobého zajištění provozu řešení ARCLib.