Krok 1.: Kontrola
Požadavky na absolvování
V rámci kroku Kontrola datových souborů/kódu a čtení dokumentace zajistíme soubor dat inventarizací a kontrolou obsahu, přičemž použijeme místní kritéria hodnocení a výběru.
Mezi běžné kroky kontroly patří:
- Ověření, zda nabízená data odpovídají ujednáním s původcem.
- Datové validace v podobě strojových kontrol integrity a konzistence dat pomocí archiváři dostupných nástrojů.
- Inventarizace obsahu datových souborů (např. otevření a vzorkování souborů nebo kódu).
- Ověření veškerých metadat poskytnutých původcem a kontrola dostupné dokumentace.
Klíčové aspekty, které je nezbytné zohlednit při výběru a zpracování archiválií:
- Přezkoumejte legislativní základ pro přítomnost citlivých údajů a případné dohody o jejich využívání; prozkoumejte potenciální dopady sdílení těchto údajů. Zvažte:
- Přítomnost citlivých osobních údajů a rizika spojená s jejich zpřístupněním.
- Autorskoprávní otázky, např. zda využít doporučené vzory licenčních dohod dostupné v NArP nebo zda postačí běžný protokol o výběru archiválií.
- Zda je přiložena licence pro využívání dat, popř. smlouva mezi původcem a tvůrcem datasetu.
- Byl dataset částečně dostupný v podobě otevřených dat?
- Je možné, že soubor údajů může mít dopad na určitou skupinu osob?
- Řídí se tato sestava dat zásadami dodržování předpisů nebo jinými institucionálními pravidly?
Základní úkoly:
- Zahájení vedení kroků archiváře pro rozhodnutí o trvalém uložení.
- Inventarizace datové sady ve smyslu úplnosti dohodnutého obsahu.
- Validace.
- Identifikace formátů souborů.
- Kontrola organizace souborů, hierarchie a způsobů pojmenování.
- Rozbalování souborů ZIP, pokud je to možné.
- Vytvoření pracovní kopie souborů pro formální inventarizaci a testování.
- Kontrola kódu, zda v něm nejsou zjevné chyby, nechybí komponenty atd. (dle schopností a znalostí archiváře).
- Kontrola, zda jsou metadata kvalitní, přesná a úplná podle institucionálních požadavků (minimálně metadata vyžadovaná v rámci výběru z volných souborů).
- Zvolte typ přiložené dokumentace (README / Kniha kódu / Datový slovník / jiné) a poznamenejte si, zda je:
- kompletní,
- potřebuje opravit,
- pokud chybí, doložte krok „Doplnění“.
- Kontrola, zda jsou přítomny citlivé osobní údaje. Pokud ano, vyžádejte si formulář souhlasu / zákonné zmocnění nebo jiný doklad.
- Pokud údaje nejsou anonymizovány, zaznamenání tohoto do metadat.
- Kontrola, zda je dataset vázán licenčními podmínkami, smlouvou nebo obdobnými omezeními. Pokud ano, vyžádejte si platné znění (podmínek, smlouvy, licence apod.). Datasety mohou být vázány zvláštními podmínkami, které mohou platit i v případě trvalého uložení.
- Kontrola čitelnosti/zobrazitelnosti všech souborů.
- Zajištění, aby byly k datovým souborům a případným obrázkům k dispozici důkladné popisy v prostém textu nebo v přiložené dokumentaci.
- Kontrola, zda jsou vizualizace dat snadno přístupné.