V rámci kroku Kontrola datových souborů/kódu a čtení dokumentace zajistíme soubor dat inventarizací a kontrolou obsahu, přičemž použijeme místní kritéria hodnocení a výběru.

Mezi běžné kroky kontroly patří:

  • Ověření, zda nabízená data odpovídají ujednáním s původcem.
  • Datové validace v podobě strojových kontrol integrity a konzistence dat pomocí archiváři dostupných nástrojů.
  • Inventarizace obsahu datových souborů (např. otevření a vzorkování souborů nebo kódu).
  • Ověření veškerých metadat poskytnutých původcem a kontrola dostupné dokumentace.

Klíčové aspekty, které je nezbytné zohlednit při výběru a zpracování archiválií:

  • Přezkoumejte legislativní základ pro přítomnost citlivých údajů a případné dohody o jejich využívání; prozkoumejte potenciální dopady sdílení těchto údajů. Zvažte:
    • Přítomnost citlivých osobních údajů a rizika spojená s jejich zpřístupněním.
    • Autorskoprávní otázky, např. zda využít doporučené vzory licenčních dohod dostupné v NArP nebo zda postačí běžný protokol o výběru archiválií.
    • Zda je přiložena licence pro využívání dat, popř. smlouva mezi původcem a tvůrcem datasetu.
    • Byl dataset částečně dostupný v podobě otevřených dat?
  • Je možné, že soubor údajů může mít dopad na určitou skupinu osob?
  • Řídí se tato sestava dat zásadami dodržování předpisů nebo jinými institucionálními pravidly?

Základní úkoly:

  • Zahájení vedení kroků archiváře pro rozhodnutí o trvalém uložení.
  • Inventarizace datové sady ve smyslu úplnosti dohodnutého obsahu.
  • Validace.
  • Identifikace formátů souborů.
  • Kontrola organizace souborů, hierarchie a způsobů pojmenování.
  • Rozbalování souborů ZIP, pokud je to možné.
  • Vytvoření pracovní kopie souborů pro formální inventarizaci a testování.
  • Kontrola kódu, zda v něm nejsou zjevné chyby, nechybí komponenty atd. (dle schopností a znalostí archiváře).
  • Kontrola, zda jsou metadata kvalitní, přesná a úplná podle institucionálních požadavků (minimálně metadata vyžadovaná v rámci výběru z volných souborů).
  • Zvolte typ přiložené dokumentace (README / Kniha kódu / Datový slovník / jiné) a poznamenejte si, zda je:
    • kompletní,
    • potřebuje opravit,
    • pokud chybí, doložte krok „Doplnění“.
  • Kontrola, zda jsou přítomny citlivé osobní údaje. Pokud ano, vyžádejte si formulář souhlasu / zákonné zmocnění nebo jiný doklad.
  • Pokud údaje nejsou anonymizovány, zaznamenání tohoto do metadat.
  • Kontrola, zda je dataset vázán licenčními podmínkami, smlouvou nebo obdobnými omezeními. Pokud ano, vyžádejte si platné znění (podmínek, smlouvy, licence apod.). Datasety mohou být vázány zvláštními podmínkami, které mohou platit i v případě trvalého uložení.
  • Kontrola čitelnosti/zobrazitelnosti všech souborů.
  • Zajištění, aby byly k datovým souborům a případným obrázkům k dispozici důkladné popisy v prostém textu nebo v přiložené dokumentaci.
  • Kontrola, zda jsou vizualizace dat snadno přístupné.