Udtræksprogram til databaseindhold

Udtræksprogram til databaseindhold

Tag de første skridt mod at lave en arkiveringsversion med ”Database Preservation Toolkit”

alt

Database Preservation Toolkit

Hvad er Database Preservation Toolkit?

Database Preservation Toolkit er en applikation, der kan anvendes til at trække dataindhold, datastrukturer og metadata fra forskellige relationelle databasemanagementsystemer ud til en række bevaringsformater. Applikationen er udviklet i åben kildekode (open source), og er tilgængeligt på www.database-preservation.com.

Brugsvejledningen bygger på brugen af developerversionen.

Hvad kan DBPTK?

DBPTK kan eksportere fra f.eks. PostgreSQL-, Oracle- og MS SQL-databaser til det åbne arkiveringsformat SIARD-DK, som bekendtgørelse 128 bygger på – og dermed det databaseformat, som Rigsarkivet kræver, at arkiveringsversioner afleveres i. Værktøjet kan anvendes til at udtrække følgende filer, der skal placeres i en arkiveringsversion: Tabelindhold (f.eks. table1.xml) og den tilhørende tabelindeksfil (tableIndex.xml).

Der er dog en række forhold, som Database Preservation Toolkit ikke håndterer i forhold til at lave en fuld arkiveringsversion. De dannede tabelfiler og tabelindeksfilen kan ikke stå alene, da Rigsarkivet også har krav til filformater, databeskrivelser, metadata og kontekstdokumentation i arkiveringsversionen.

Hvad kan DBPTK ikke?

  • 128 Bilag 2 fig. 2.1 viser de obligatoriske (indeks)filer ud over tabelfilerne og tableIndex.xml. Hvis der også skal afleveres filer fra systemet i form af billeder, lyd, video eller geodata, kræver det yderligere bearbejdning af arkiveringsversionen for at overholde fil- og formatkrav jf. bekendtgørelse 1007 og 128.
  • Bemærk, at systemdokumentation i form af tabel- og kolonnebeskrivelser evt. manuelt skal suppleres (for eksempel hvis disse oplysninger ikke er indlejret i selve databasen) enten inden eksport af databasen eller efterfølgende i filen tableIndex.xml.
  • Dette gælder også kodede værdier, hvis oversættelse heraf ikke findes i databasen, og ligeledes tabelrelationer som ikke fremgår eksplicit af selve databasen.
  • Hvis systemet trækker på flere end én database kommer DBPTK til kort, idet værktøjet kun kan eksportere fra én database af gangen. Det kræver således yderligere bearbejdning hvis arkiveringsversionens indhold bygger på en sammenfletning af flere databaser.

Brug af DBPTK

Database Preservation Toolkit er udviklet i et EU-samarbejde af Keep. Rigsarkivet tilbyder derfor ingen støtte i brugen af DBPTK. Alle henvendelser og spørgsmål herom skal ske til udvikleren eller via info@keep.pt.

Rigsarkivet understreger, at al brug af Database Preservation Toolkit i produktionen af arkiveringsversioner ikke garanterer en compliant arkiveringsversion. Alle arkiveringsversioner skal overholde bekendtgørelse 128 og Rigsarkivet anbefaler, at de testes med Rigsarkivets testværktøj, ADA, inden aflevering.

Rigsarkivet har udarbejdet følgende vejledning om DBPTK: