Choď na obsah Choď na menu
 


Niečo z histórie

Digitalizácia je úžasná vec s úžasnými možnosťami, ale zamysleli ste sa nad spôsobom dlhodobej archivácie údajov? Zaistiť prístup k dnešným digitálnym dátam v budúcnosti je veľká výzva. A komplexnosť tohto problému navyše narastá s exponenciálne rastúcim objemom údajov.

Poučme sa z nedávnej histórie

Skúste zaloviť v pamäti, ako ste s nadšením kupovali nové stále modernejšie médiá na ukladanie údajov s čoraz vyššou kapacitou. Najskôr to boli 8", neskôr 5,25" diskety v ohybnom plastovom obale. Tie následne úplne vytlačili moderné 3,5" diskety v pevnom plastovom obale. Ich kapacita 1,44 MB však veľmi rýchlo prestala stačiť a nastalo krátke bezvládie, čo sa týka štandardov. Bolo to obdobie, keď sa hľadala náhrada za diskety a rôzni výrobcovia sa snažili presadiť rôznymi konštrukciami prepisovateľných médií typu ZIP, JAZZ a podobne. Napokon sa stalo de facto štandardom ukladanie údajov na zapisovateľné a prepisovateľné CD a DVD médiá. Skúsili ste čítať údaje z prvých CD-R, ktoré vstúpili do komerčného štádia v roku 1988? Určite by sa vám to podarilo, tieto médiá boli veľmi kvalitné a zároveň veľmi drahé. Potom však kvalita ustúpila požiadavke na čo najnižšiu cenu a z bežných lacných médií po roku 1995 by ste dnes – po vyše 20 rokoch – už všetky údaje zrejme neprečítali. Možno z archívnych diskov, ktoré sú však niekoľkonásobne drahšie ako štandardné. Alebo iný rébus. Čo by ste urobili, keby sa vám dostalo do ruky médium typu ZIP alebo JAZZ, využívajúce podobne ako pevný disk jednu alebo viac kovových platní? Ako by ste sa dostali k údajom na takomto médiu, aj keby ste vedeli, že sú veľmi dôležité? Zohnať príslušné zariadenie vo funkčnom stave je už teraz veľmi ťažké. A čo o 20 či 50 rokov? Ak to zosumarizujeme, potrebujeme spôsob, ako uchovať digitálne údaje na stovky rokov a ako k nim v budúcnosti získať prístup, keď prístroje, pomocou ktorých boli tieto dáta zaznamenávané, nájdeme iba v múzeách, ak vôbec.

Uchovávanie na fyzických médiách

Ak archeológovia nájdu nejaký dokument, či už na papyruse, pergamene, papieri, alebo vytesaný do kameňa, dokážu s ním pracovať, prečítať ho a rozlúštiť jeho kódovanie, teda znakovú abecedu. Z tejto analógie vyplýva nielen to, že dôležité dokumenty a údaje by sa mali ukladané na osvedčené fyzické médiá, ale mali by byť buď priamo čitateľné človekom, alebo v prípade, ak sú kódované, malo by archívne médium obsahovať definíciu kódu, a to v podobe čitateľnej pre človeka.

Do kategórie fyzických médií patria, samozrejme, aj magnetické pásky, diskety či disky, no tie strácajú časom svoje vlastnosti a navyše sú veľmi citlivé na vonkajšie vplyvy, napríklad na magnetické pole, teplotu a podobne. Naproti tomu optický záznam na kvalitnom filme má oveľa dlhšiu životnosť. Fotografický film sa začal používať v roku 1868, takže táto metóda je časom dôkladne preverená. Záznam na film má aj veľa ďalších výhodných vlastností. Dá sa predpokladať, že zariadenia na projekciu a zväčšenie budú k dispozícii vždy, takže na film sa dajú ukladať buď priamo snímky dôležitých dokumentov, alebo aj digitálne údaje s použitím vhodného kódovania využívajúceho svetlé a tmavé plôšky na podobnom princípe ako populárne QR kódy. Kľúčová výhoda filmu je aj v tom, že ide o médium bez možnosti prepisovania, takže raz zapísané údaje sú nemenné.

Problémy a hľadanie riešení

Ak ste sa zamysleli nad scenárom z predchádzajúcej state, teda že by ste potrebovali prečítať dôležité údaje z netypického či zastaraného média, takáto situácia je skôr výnimka než pravidlo. Dôvodom je priebežná migrácia. Údaje z diskiet, aspoň tie dôležité, totiž boli postupne ukladané na novšie médiá, napríklad na CD-R alebo DVD-R, prípadne na pásky či disky. Periodicita priebežnej migrácie je v závislosti od typu archívneho média zhruba 4 až 8 rokov. Priebežná migrácia sa však s exponenciálnym nárastom údajov stáva čoraz náročnejšou. Preto by bolo výhodné ukladať skutočne dôležité údaje a tých nebýva až tak veľa na definitívnom médiu, určenom na dlhodobé uskladnenie. Ak to zhrnieme, najväčšie problémy archivácie údajov sú životnosť dátových úložísk, zastarávanie čítacích zariadení a ich vyraďovanie z prevádzky a predovšetkým meniace sa médiá na ukladanie a meniace sa formáty dátových súborov. Preto dôležité údaje ukladáme na viacerých miestach, viacerými spôsobmi a priebežne migrujeme a obnovujeme dáta každých 3 až 5 rokov.