Aflever databaser

Aflever databaser

Data i diverse databaseformater.

alt

Forskningsdata der er skabt eller lagret i databaser skal afleveres som en arkiveringsversion.

Hvad er en arkiveringsversion?

En arkiveringsversion er et udtræk af data og eventuelle dokumenter suppleret med dokumentation af data. Udtrækket skal afleveres i et bestemt teknisk format som fremgår af bilag 1-8 i bekendtgørelse nr. 128 om aflevering af arkiveringsversioner til Rigsarkivet.

En arkiveringsversion består af:

  • udtræk af datatabeller
  • eventuelle dokumenter
  • information om arkiveringsversionen (kontekstdokumentation)

Alle tre elementer er lagret i en fast struktur. Du kan downloade eksempler på forskellige arkiveringsversioner.

Database Preservation Toolkit- udtræksprogram til databaser

Hvad er Database Preservation Toolkit?

Database Preservation Toolkit er en applikation, der kan anvendes til at trække dataindhold, datastrukturer og metadata fra forskellige relationelle databasemanagementsystemer ud til en række bevaringsformater. Applikationen er udviklet i åben kildekode (open source), og er tilgængeligt på www.database-preservation.com.

Brugsvejledningen bygger på brugen af developerversionen.

Hvad kan DBPTK?

DBPTK kan eksportere fra f.eks. PostgreSQL-, Oracle- og MS SQL-databaser til det åbne arkiveringsformat SIARD-DK, som bekendtgørelse 128 bygger på – og dermed det databaseformat, som Rigsarkivet kræver, at arkiveringsversioner afleveres i. Værktøjet kan anvendes til at udtrække følgende filer, der skal placeres i en arkiveringsversion: Tabelindhold (f.eks. table1.xml) og den tilhørende tabelindeksfil (tableIndex.xml).

Der er dog en række forhold, som Database Preservation Toolkit ikke håndterer i forhold til at lave en fuld arkiveringsversion. De dannede tabelfiler og tabelindeksfilen kan ikke stå alene, da Rigsarkivet også har krav til filformater, databeskrivelser, metadata og kontekstdokumentation i arkiveringsversionen.

Hvad kan DBPTK ikke?

  • 128 Bilag 2 fig. 2.1 viser de obligatoriske (indeks)filer ud over tabelfilerne og tableIndex.xml. Hvis der også skal afleveres filer fra systemet i form af billeder, lyd, video eller geodata, kræver det yderligere bearbejdning af arkiveringsversionen for at overholde fil- og formatkrav jf. bekendtgørelse 1007 og 128.
  • Bemærk, at systemdokumentation i form af tabel- og kolonnebeskrivelser evt. manuelt skal suppleres (for eksempel hvis disse oplysninger ikke er indlejret i selve databasen) enten inden eksport af databasen eller efterfølgende i filen tableIndex.xml.
  • Dette gælder også kodede værdier, hvis oversættelse heraf ikke findes i databasen, og ligeledes tabelrelationer som ikke fremgår eksplicit af selve databasen.
  • Hvis systemet trækker på flere end én database kommer DBPTK til kort, idet værktøjet kun kan eksportere fra én database af gangen. Det kræver således yderligere bearbejdning hvis arkiveringsversionens indhold bygger på en sammenfletning af flere databaser.

Brug af DBPTK

Database Preservation Toolkit er udviklet i et EU-samarbejde af Keep. Rigsarkivet tilbyder derfor ingen støtte i brugen af DBPTK. Alle henvendelser og spørgsmål herom skal ske til udvikleren eller via info@keep.pt.

Rigsarkivet understreger, at al brug af Database Preservation Toolkit i produktionen af arkiveringsversioner ikke garanterer en compliant arkiveringsversion. Alle arkiveringsversioner skal overholde bekendtgørelse 128 og Rigsarkivet anbefaler, at de testes med Rigsarkivets testværktøj, ADA, inden aflevering.

Rigsarkivet har udarbejdet følgende vejledning om DBPTK:

Brug af leverandør

Du kan overveje at anvende en leverandør til bistå afleveringen af arkiveringsversionen. Rigsarkivet har udarbejdet en liste med oplysninger om leverandører, der har udarbejdet og fået godkendt en eller flere arkiveringsversioner af it-systemer efter reglerne i bekendtgørelse nr. 128 om arkiveringsversioner.

Hvis du har spørgsmål til din aflevering

Hvis du støder på problemer, når du tester eller skaber din afleveringspakke, skriv spørgsmål til mailbox@rigsarkivet.dk, att. Forskningsdatamanager.