Udtræksprogram til databaseindhold
Udtræksprogram til databaseindhold
Tag de første skridt mod at lave en arkiveringsversion med ”Database Preservation Toolkit”
Database Preservation Toolkit
Hvad er Database Preservation Toolkit?
Database Preservation Toolkit er en applikation, der kan anvendes til at trække dataindhold, datastrukturer og metadata fra forskellige relationelle databasemanagementsystemer ud til en række bevaringsformater. Applikationen er udviklet i åben kildekode (open source), og er tilgængeligt på www.database-preservation.com.
Brugsvejledningen bygger på brugen af developerversionen.
Hvad kan DBPTK?
DBPTK kan eksportere fra f.eks. PostgreSQL-, Oracle- og MS SQL-databaser til det åbne arkiveringsformat SIARD-DK, som bekendtgørelse 128 bygger på – og dermed det databaseformat, som Rigsarkivet kræver, at arkiveringsversioner afleveres i. Værktøjet kan anvendes til at udtrække følgende filer, der skal placeres i en arkiveringsversion: Tabelindhold (f.eks. table1.xml) og den tilhørende tabelindeksfil (tableIndex.xml).
Der er dog en række forhold, som Database Preservation Toolkit ikke håndterer i forhold til at lave en fuld arkiveringsversion. De dannede tabelfiler og tabelindeksfilen kan ikke stå alene, da Rigsarkivet også har krav til filformater, databeskrivelser, metadata og kontekstdokumentation i arkiveringsversionen.
Hvad kan DBPTK ikke?
- 128 Bilag 2 fig. 2.1 viser de obligatoriske (indeks)filer ud over tabelfilerne og tableIndex.xml. Hvis der også skal afleveres filer fra systemet i form af billeder, lyd, video eller geodata, kræver det yderligere bearbejdning af arkiveringsversionen for at overholde fil- og formatkrav jf. bekendtgørelse 1007 og 128.
- Bemærk, at systemdokumentation i form af tabel- og kolonnebeskrivelser evt. manuelt skal suppleres (for eksempel hvis disse oplysninger ikke er indlejret i selve databasen) enten inden eksport af databasen eller efterfølgende i filen tableIndex.xml.
- Dette gælder også kodede værdier, hvis oversættelse heraf ikke findes i databasen, og ligeledes tabelrelationer som ikke fremgår eksplicit af selve databasen.
- Hvis systemet trækker på flere end én database kommer DBPTK til kort, idet værktøjet kun kan eksportere fra én database af gangen. Det kræver således yderligere bearbejdning hvis arkiveringsversionens indhold bygger på en sammenfletning af flere databaser.
Brug af DBPTK
Database Preservation Toolkit er udviklet i et EU-samarbejde af Keep. Rigsarkivet tilbyder derfor ingen støtte i brugen af DBPTK. Alle henvendelser og spørgsmål herom skal ske til udvikleren eller via info@keep.pt.
Rigsarkivet understreger, at al brug af Database Preservation Toolkit i produktionen af arkiveringsversioner ikke garanterer en compliant arkiveringsversion. Alle arkiveringsversioner skal overholde bekendtgørelse 128 og Rigsarkivet anbefaler, at de testes med Rigsarkivets testværktøj, ADA, inden aflevering.
Rigsarkivet har udarbejdet følgende vejledning om DBPTK:
Download programmet
Programmet er frit tilgængeligt på www.database-preservation.com, hvor du kan læse mere om værktøjet.
Relaterede sider
Aflever IT-systemer fra kommune og region
Kommuner og regioner skal aflevere bevaringsværdige data fra it-systemer til et offentligt arkiv.
Lovgivning og vejledning om aflevering af it-systemer
Lovgivning og vejledning der vedrører afleveringen af offentlige myndigheders it-systemer
ADA – testprogram til arkiveringsversioner
ADA er Rigsarkivets program til at teste om en arkiveringsversion lever op til kravene i bekendtgørelse nr. 128 af 12. februar 2020.
Arkiveringsversioner – se eksempler
Se eksempler på hvordan forskellige typer it-systemer ser ud i arkiveringsversioner
Indexfiler der skal indgå i arkiveringsversionen
I arkiveringsversionen skal indgå indexfiler til beskrivelse og dokumentation af arkiveringsversionen.
Lovgivning og vejledning om aflevering af it-systemer
Lovgivning og vejledning der vedrører afleveringen af offentlige myndigheders it-systemer