Webarchivaris Webarchivaris

Versiebeheer van opnamen: meerdere momentopnamen

Elke crawl is een momentopname

Iedere keer dat wij een website archiveren, ontstaat een momentopname: een vastgelegde toestand op een specifiek tijdstip. Door regelmatig te archiveren bouwt u een reeks van zulke opnamen op. In de terugkijk- en replay-omgeving kiest u vervolgens een datum en bekijkt u de site precies zoals die er toen uitzag.

Versienummering vX-Y

Om opnamen onderling te onderscheiden, hanteren wij een versienummering in de vorm vX-Y. Het eerste getal staat voor de versie (de momentopname als geheel); het tweede voor het deel, of part, binnen die versie. Grote crawls worden namelijk over meerdere bestanden verdeeld; de part-aanduiding houdt die delen bij elkaar en in de juiste volgorde. Zo verwijst v3-2 ondubbelzinnig naar het tweede deel van de derde versie.

Gestructureerde WARC-naamgeving

Die nummering werkt door in de naamgeving van de .warc-bestanden. Elk bestand draagt een gestructureerde naam waarin de versie en het part herkenbaar zijn opgenomen. Daardoor is aan de bestandsnaam alleen al af te lezen tot welke momentopname en welk deel het hoort — handig bij export, overdracht en handmatige controle.

Eenduidig terugvindbaar

Versienummering en naamgeving samen zorgen ervoor dat geen enkele opname verloren raakt of verwisseld wordt. Elke versie blijft eenduidig terugvindbaar, of u nu terugkijkt in de viewer, full-text zoekt over de hele keten, of een specifieke momentopname downloadt. Bij incrementeel archiveren blijven ook ongewijzigde onderdelen via de juiste versie bereikbaar, zonder dubbele opslag.