Toegankelijkheid

Skip to main content

Op deze pagina:

Onze archiverings voorziening

Informatie ontvangen over het archiveren van uw website?

  • NL opslag

  • ISO 28500
  • Betaalbaar
  • Open-source

Onze archiverings voorziening

Onze website archiveringsvoorziening bestaat uit 2 functies:

  • Het periodiek crawlen van websites en het maken van .warc archieven die voldoen aan de technische eisen in de richtlijn archivering overheidswebsites.
  • Een openbare SaaS omgeving waarin men de periodiek opgeslagen archieven van uw website rechtstreeks kan bekijken alsof ze over uw website browsen op een gekozen datum in het verleden. Ook kan men zelf de individuele .warc bestanden downloaden.

Periodiek crawlen / harvesten

Vanuit ons serverplatform op het KPN netwerk wordt door onze website archiveringsvoorziening dagelijks een harvestingsessie opgestart. De server download daarbij elke openbare pagina van uw website. Het is niet nodig om vooraf een lijst met pagina's aan te leveren: onze crawler indexeert alle links op uw pagina's en bezoekt deze automatisch. Dat maakt onze harvestingdienst vrijwel vrij van input uwerzijds. Het enige dat we nodig hebben is de url van uw website en vanaf daar doet onze crawler de rest.

Als onze website archiveringsvoorziening alle pagina's gedownload heeft dan worden deze ingepakt in een zogenaamd .warc archief. Dit is vergelijkbaar met een .zip bestand. Onze .warc archieven voldoen aan de technische eisen uit de richtlijn archivering overheidswebsites. Zo zijn ze niet voorzien van encryptie, worden ze geplitst in bestanden van maximaal 1GB groot en voldoen ze aan ISO 28500-2008. De archieven kunnen door u in een later stadium dus rechtstreeks overgedragen worden aan het nationaal archief, indien gewenst.

Openbare SaaS omgeving voor terugkijken

Alleen het archiveren is vereist om te voldoen aan de Archiefwet. Maar wij gaan verder: onze website archiveringsvoorziening bevat een openbare online omgeving aan waarin eenieder de pagina's van uw website kan bekijken in de staat zoals die was op een eerdere datum.

In een datumkiezer kiest men een datum. Onze serverside software zoekt vervolgens het bijbehorende .warc archief op en pakt deze uit. De opgevraagde pagina's worden vervolgens als de oorspronkelijke html/css/javascript naar de browser van de bezoeker gestuurd zodat die over uw website kan browsen en informatie kan raadplegen zoals die op de gekozen datum gepubliceerd was zonder dat daarvoor een .warc archief gedownload hoeft te worden.

Het downloaden van afzonderlijke .warc bestanden is wel mogelijk: deze zijn gerangschikt naar jaar/maand/dag en kunnen door eenieder gedownload en geopend worden. Naast een unieke url waarmee men uw website terug kan kijken ontvangt u een unieke url waarmee men de .warc archiefbestanden kan zoeken en downloaden.

Datumkiezer:

Datumkiezer

Voorbeeld

Bekijk de archiefpagina van Regio Hart van Brabant voor een voorbeeld:
https://www.webarchivaris.nl/lijst/regio-hartvanbrabant-nl

Contact

Uw website ook laten archiveren? Bijvoorbeeld om te voldoen aan wettelijke verplichtingen, voor transparantie en verantwoording of behoud van cultureel erfgoed? Neem snel contact op. Wij beantwoorden graag uw vragen en voorzien u vrijblijvend van een prijsopgave.