Veelgestelde vragen
Antwoorden op de vragen die we het vaakst krijgen over het archiveren van websites. Staat uw vraag er niet bij? Neem gerust contact op.
In welk bestandsformaat worden de archieven opgeslagen?
Onze archieven worden opgeslagen in het ongecomprimeerde ISO 28500 .warc-formaat, conform de richtlijn voor het archiveren van overheidswebsites.
Wordt er rekening gehouden met actuele ontwikkelingen in het standaardformaat?
Ja. We volgen de richtlijn voor het archiveren van overheidswebsites en hanteren een behoudende aanpak bij wijzigingen, zodat de bestanden ook over 10 tot 20 jaar nog leesbaar zijn.
Welke metadata wordt opgeslagen in de archieven?
In de WARC/1.1-headers leggen we onder meer vast: datum, record-ID, content-type, de doel-URI (WARC-Target-URI), de payload- en block-digest (SHA-256) en de gebruikte software (Browsertrix-Crawler). De volledige HTTP-response-headers blijven in de responsrecords bewaard. Aanvullende metadata per pagina (titel, tekst en tijdstip) leggen we vast in een aparte index naast het archief.
Wordt er compressie toegepast bij de opslag?
Nee, conform de richtlijn slaan we de .warc-bestanden ongecomprimeerd op in onze S3-opslag.
Wat als de website gecomprimeerd wordt geserveerd (gzip)?
Het .warc-formaat bewaart de onbewerkte serverrespons. Gespecialiseerde .warc-viewers decomprimeren de inhoud bij het tonen.
Waar wordt de data opgeslagen?
Alle archieven worden opgeslagen in S3-opslag binnen Nederlands grondgebied. Deze opslag is Multi-AZ: de data staat verspreid over drie zones, zodat het uitvallen van één zone geen gegevensverlies oplevert.
Maken jullie aparte back-ups?
De S3-opslag is zelf al redundant: door de Multi-AZ-opzet (drie zones, waarvan er één mag uitvallen) blijven uw archieven beschikbaar en intact, ook bij een storing in een zone. Aanvullend kunt u uw .warc-archieven altijd zelf downloaden via de webinterface of via WebDAV, en zo desgewenst een eigen kopie bewaren.
Kunnen we onze archieven exporteren?
Ja, op drie manieren: u downloadt losse archieven rechtstreeks, u haalt meerdere archieven in één keer op via WebDAV, of u maakt een MDTO-export naar een SFTP-opslag — handig voor overdracht naar een e-depot.
In welke structuur worden de archieven opgeslagen?
Hiërarchisch per organisatie en website, en daarbinnen per jaar, maand en dag. Per opname vindt u de .warc-bestanden, de .cdxj-index, de paginatekst-index en een apart, ondertekend manifest met de checksums (SHA-256 en SHA-512).
Hoe wordt de integriteit van de archieven gewaarborgd?
Na het archiveren genereren we checksums; aanvullende checksums binnen de .warc-bestanden verifiëren zowel de afzonderlijke payload als het volledige archief. Elk archief kan bovendien voorzien worden van een digitale handtekening als juridisch bewijs.
Kunnen de archieven overgezet worden naar een ander e-depot?
Ja. Wij bewaren uw archieven zo lang u wilt; u bepaalt zelf wanneer u ze overdraagt aan een e-depot of naar uw eigen opslag — er is geen verplichte overdracht. Archieven die voldoen aan ISO 28500 kunnen worden overgezet naar andere conforme e-depots; de exacte structuureisen kunnen per e-depot verschillen.
Kunnen de archieven 'live' teruggekeken worden?
Ja. Via een webinterface selecteert u een datum en bekijkt u de website zoals die er toen uitzag, met navigatie tussen pagina's en datums.
Is er een zoekfunctie in de terugkijkfunctie?
Ja. In de terugkijkfunctie navigeert u op datum, zoekt u op URL én doorzoekt u de gearchiveerde pagina's op full-text.
Kan ik rapportages ontvangen?
Ja, na elke crawl ontvangt u optioneel een e-mailrapport met onder meer de omvang (in MB) en het aantal pagina's. U stelt zelf in wanneer u dit ontvangt: altijd, alleen bij fouten, of alleen bij succes.
Hoe zit het met kostenontwikkelingen?
In de prijs houden we rekening met groei tot circa 10% per jaar; bij sterk groeiende archieven volgt een nieuw voorstel. Jaarlijks indexeren we conform de CBS-inflatiecijfers, met de mogelijkheid om jaarlijks op te zeggen.
Zijn er kosten verbonden aan het exporteren of overstappen?
Nee. U kunt op elk moment vrij bij de opgeslagen archieven — via de webinterface, via WebDAV of via een MDTO-export naar SFTP.
