Webarchivaris Webarchivaris

Onze archiveringsvoorziening

Drie functies

De voorziening combineert drie functies: periodiek crawlen, terugkijken en het ontsluiten van de archieven.

1. Periodiek crawlen

Het systeem start automatisch een oogst-sessie die alle openbare pagina's van uw website ophaalt. U hoeft daarvoor geen lijst met pagina's aan te leveren: de crawler volgt de links op de website zelf. De vastgelegde inhoud wordt verpakt in .warc-archieven, conform de richtlijn voor het archiveren van overheidswebsites. Frequentie en omvang zijn instelbaar.

2. Terugkijken

Via een datumkiezer bekijkt u uw website in de toestand zoals die op een eerdere datum was. Het systeem haalt de bijbehorende archieven automatisch op en toont de pagina's — u hoeft daarvoor zelf geen .warc-archief te downloaden of uit te pakken. In de terugkijkfunctie kunt u bovendien full-text door de gearchiveerde inhoud zoeken. Voor het basisgebruik is geen technische kennis nodig.

3. Ontsluiten van de archieven

Wilt u de onderliggende bestanden zelf in handen? Dat kan op drie manieren: u downloadt losse .warc-archieven (navigeer via jaar > maand > dag), u haalt meerdere archieven in één keer op via WebDAV, of u maakt een MDTO-export naar een SFTP-opslag — bijvoorbeeld voor overdracht naar een e-depot.

Het archiefformaat

De archieven worden opgeslagen als .warc-bestanden (Web ARChive), conform de internationale norm ISO 28500 (WARC 1.1). Wij slaan ongecomprimeerd op. Grote oogsten worden over meerdere bestanden verdeeld, zodat de archieven goed hanteerbaar blijven. Meer hierover leest u op wat is een .warc-archief.

Opslag en integriteit

De opslag is S3-compatibel en draait standaard in Nederland, altijd binnen de EU. Dat kan in uw eigen bucket of in onze bucket, zonder vendor lock-in. Wij bewaren uw archieven zo lang u wilt; u bepaalt zelf wanneer u ze overdraagt aan een e-depot of naar uw eigen opslag — er is geen verplichte overdracht. De integriteit van elk archief is geborgd met checksums en een digitale handtekening, los opgeslagen als juridisch bewijs. De toegang is beveiligd met een wachtwoord en optionele tweefactorauthenticatie (TOTP).

Een Nederlandse dienstverlener

Webarchivaris is een Nederlandse dienstverlener en richt zich primair op overheden en publieke organisaties. De voorziening is gebouwd op gecontroleerde open-source software. Bekijk ook ons archiveringsplatform en het stappenplan.