Webarchivaris Webarchivaris

Duurzame bestandsformaten en format-watch (PRONOM)

Waarom het formaat ertoe doet

Bij het archiveren van een website worden allerlei bestandstypen vastgelegd: HTML, afbeeldingen, stylesheets, PDF's en mediabestanden. Sommige formaten zijn breed gedragen en blijven decennialang leesbaar; andere zijn verouderd of afhankelijk van software die straks niet meer bestaat. Voor langdurige bewaring is het daarom belangrijk dat bestanden zo veel mogelijk in herkenbare, open voorkeursformaten staan.

PRONOM als referentie

PRONOM is een openbare, internationaal gebruikte registratie van bestandsformaten, beheerd door het Britse National Archives. Elk formaat krijgt er een unieke aanduiding (een PUID) met informatie over kenmerken en houdbaarheid. Door gearchiveerde bestanden tegen PRONOM te herkennen, weten wij precies welke formaten in uw archief voorkomen en welke daarvan aandacht vragen.

Format-watch: blijvend bewaken

Onze format-watch identificeert de formaten in het archief en signaleert wanneer een formaat als risicovol of verouderd te boek staat. Zo blijft inzichtelijk of de inhoud in voorkeursformaten staat en kan er tijdig op worden geacteerd — ruim voordat een formaat een leesbaarheidsprobleem wordt. Deze signalering vormt een vast onderdeel van de duurzaamheidsbewaking, naast de onveranderbare WARC-opslag zelf.

Onderdeel van een breder bewaarregime

Format-watch staat niet op zichzelf. De bevindingen worden vastgelegd als levensloop-events bij het archief, zodat aantoonbaar is wat er wanneer is geconstateerd. Samen met fixity-controles en de doorzoekbare ontsluiting vormt dit een samenhangend regime voor duurzame, controleerbare bewaring. Meer hierover leest u op onze pagina duurzaamheid.