Webarchivaris.nl
Voor compliancy, de Archiefwet en preservering.

Wij verzorgen website archivering. Onze archiveringsvoorziening voldoet aan de technische eisen uit de richtlijn archiveren overheidswebsites. Inclusief harvesten, archiveren, opslag en functie om oude pagina's live terug te kijken. Laat ons uw website archiveren.

Logo Webarchivaris

Website laten archiveren

Archiefwet 1995 / richtlijn archiveren overheidswebsites.

Laat ons uw website archiveren. Onze website archieven voldoen aan de eisen uit de Richtlijn archiveren overheidswebsites c.q. de Archiefwet 1995. Onze .warc archieven zijn conform ISO 28500 en we bieden een aantrekkelijk totaalpakket zodat u niet zelf de kennis en IT in huis hoeft te halen die nodig is voor website archivering.

Standaard maken wij dagelijks een snapshot van uw website. Via een interface is kan men elke dag terugkijken of archieven downloaden als .warc bestand. De kosten voor het archiveren zijn afhankelijk van de complexiteit en de grootte van uw website.

Kosteneffectief uw website laten archiveren voor de Archiefwet? Neem snel contact op .

Hoe ziet het er uit?

Bekijk bijvoorbeeld de archiefpagina van Regio Hart van Brabant.

Via de kalender kiest de gebruiker een datum om terug te kijken. Vervolgens verschijnt in het scherm de gearchiveerde website van de gekozen datum. Via een andere knop verschijnt de lijst van .warc archieven om te downloaden.

Het nut van website archivering

De overheid publiceert steeds meer besluiten, bekendmakingen en informatie digitaal. Burgers die naar aanleiding hiervan actie ondernemen of juist iets nalaten moeten altijd kunnen terugvallen op wat er op dat moment gepubliceerd was, ongeacht latere aanpassingen. Elke versie van zo'n digitale publicatie moet dus gearchiveerd worden.

Dit geld ook voor veel (semi)publieke organisaties, bedrijven, banken en verzekeraars.

Dat is precies de gedachte achter website archivering en de richtlijn archivering overheidswebsites. Website archivering is een cruciaal onderdeel van eerlijk en transparant communiceren 'zoals het hoort'.


De technische kant van website archivering

Met website archivering maken we periodiek een snapshot van uw gehele website. Hiervoor ontdekt en bezoekt onze webcrawler alle pagina's op uw website. Deze worden vervolgens inclusief alle noodzakelijke bestanden bewaard in een speciaal .warc bestand; dat is de standaard op het gebied van website archivatie waarmee ondermeer ook metadata, requests en serverresponses worden opgeslagen.

Deze website archieven worden direct na het aanmaken digitaal ondertekend met een MD5 checksum en vervolgens ongecomprimeerd opgeslagen en gepubliceerd. De bestandsnamen en mapindeling maken maken zoeken makkelijk. Iedereen kan de .warc bestanden rechtstreeks downloaden of met onze voorziening 'live' over uw website browsen zoals deze op de gekozen datum op het internet stond. Het doel is om u te helpen te voldoen aan de Wet Archivering 1995 en de richtlijn archiveren overheidswebsites.

Uw website laten archiveren? Vraag vrijblijvend een offerte op.


Implementatie

Voor elk CMS

Onze webarchivering is te implementeren ongeacht het CMS op uw site. Onze harvestingdienst bezoekt uw website zoals een normale bezoeker.

Automatisering

Automatisering

Geheel automatisch wordt er dagelijks een kopie van uw hele website gemaakt. Deze wordt omgezet naar het .warc formaat, ondertekend en ter beschikking gesteld.

Opslag

Opslag

Alle data blijft in Nederland; wij gebruiken een opslagplatform in het TransIP DCG datacenter te Amsterdam gecombineerd met een optionele NL offsite back-up.

Systeem

Systeem

Ons platform staat bij het bewezen betrouwbare TransIP en werkt op Linux, Btrfs en diverse open-source componenten. Zo houden we alles in eigen hand en verlagen we de kosten.

Veiligheid

Veiligheid

Wij harvesten enkel openbaar gepubliceerde informatie. De .warc bestanden worden digitaal ondertekend met een MD5 checksum. Afhankelijk van uw keuze maken we ook back-ups.

Functies

Functies

Dagelijkse harvest, geen compressie, .warc ISO 28500, uniforme bestandsnamen, checksums, alle requests en responses, 1GB warc files, CDX index, webinterface met datumkiezer.

Archiefwet / richtlijn archiveren overheidswebsites

Puntsgewijs door de gestelde eisen

Onze website archiveringsdienst voldoet aan de onderstaande eisen uit de richtlijn archiveren overheidswebsites:

Dagelijkse harvest

Eens per maand wordt uw website volledig gearchiveerd in een op zichzelf staand archiefbestand. Daarna vindt dagelijks incrementele harvesting plaats waarbij alleen de wijzigingen worden opgeslagen. Zo gaan we slim om met opslag- en rekencapaciteit.

ISO 28500 WARC standaard

Archiefbestanden worden opgeslagen in de WARC standaard (conforms to ISO 28500-2008). Dit is de standaard op het gebied van website archivering. Onze WARC archieven worden gevalideerd door de tool WARCAT zoals genoemd in de Handreiking WARC-validatie voor webarchiefbestanden.

1GB archieven

Elk archiefbestand is maximaal +- 1GB groot. Als een archief in totaal groter is wordt dit gesplitst en automatisch genummerd met volgnummers. Dit is conform de aanbevelingen over bestandsgrootte in Annex C van de ISO 28500:2017 standaard.

Uniform bestandsnaampatroon

Voorspelbaar bestandsnaampatroon met uniforme naamgeving (<naam van archiefvormer>-<datum en tijd start harvest>-<volledig of incrementeel>-<domeinnaam van seed>-<volgnummer>-.warc).

Zonder compressie

Alle WARC archiefbestanden worden ongecomprimeerd opgeslagen. Dit gebruikt meer opslagruimte, maar hierdoor is er geen compressie-algoritme nodig dat over 20 jaar misschien niet meer bestaat en blijven uw archieven dus altijd toegankelijk.

MD5 checksums direct na creatie archief
Van elk WARC archiefbestand wordt na creatie direct een MD5 checksum gemaakt en vastgelegd in een begeleidend bestand waarmee de integriteit te controleren is.
Alle requests en responses
De webarchiefbestanden bevatten ongewijzigd en integraal alle requests aan de webserver en alle responses van de webserver die bij het harvesten zijn verzonden en ontvangen inclusief fouten en omleidingen.
Extra informatievelden / metagegevens

In het WARC-infoblok: software, format, robots. In de header van elk WARC-bestand: WARC-Block-Digest, content-Type, WARC-WARCinfo-ID. In de request en response-blokken: WARC-Target-URI.

ISO gecertificeerde opslag

Opslag- en rekenplatforms bevinden zich in Nederland bij TransIP. Zij hebben certificeringen voor ISO 27001:2013, NEN 7510:2017 en ISO 9001:2015.

Online terug door de tijd bladeren met datumkiezer

De geharveste content is is na harvesting direct online beschikbaar voor iedereen middels onze webinterface. Men kan door de gearchiveerde website bladeren alsof het de live website is. Hierbij wordt duidelijk aangegeven dat het om een gearchiveerde website gaat en is een datumkiezer beschikbaar om verder voor- of achteruit in de tijd te gaan.

Opdrachtgever krijgt alle rechten over archieven

U krijgt als opdrachtgever alle rechten over de archieven. Dat betekend dat u ze zelf ook kunt opslaan, verwerken en publiceren. Middels FTP leestoegang kunt u uw archieven snel downloaden om ze bijvoorbeeld zelf op te slaan, dupliceren, te kopiëren of over te brengen naar een archiefbewaarplaats.

Toegangsdienst

Bij onze harvestingdienst is een toegangsdienst inbegrepen. De gearchiveerde versies van uw website zijn in een online interface met datumkiezer te bekijken. Uw website is hierin te browsen alsof de bezoeker deze rechtstreeks bekijkt. Daarnaast worden de WARC bestanden en MD5 checksums als bestand ter download aangeboden.

U krijgt als opdrachtgever ook FTP leestoegang waarmee u al uw archiefbestanden snel en eenvoudig allemaal tegelijk kunt downloaden en opslaan. Bijvoorbeeld wanneer u uw archiefbestanden naar een archiefbewaarplaats wilt overbrengen.

Voor wie?

Onze dienst is bedoeld voor bedrijven en overheidsorganisaties die willen voldoen aan de Archiefwet 1995 c.q. de richtlijn archiveren overheidswebsites of eisen aan compliancy en preservering.

De Archiefwet 1995 is van toepassing op overheidsorganen, rechtspersonen die krachtens publiekrecht zijn ingesteld of publiekelijke rechtspersonen met enig openbaar bevoegd gezag en overheidsorganen die buiten de Algemene wet bestuursrecht vallen, zoals de rechterlijke macht en de Staten Generaal.

Wij nemen webarchivering
graag uit handen

Wij hebben het uitzoekwerk al gedaan. We hebben de hardware en software al gecombineerd in een robuust platform voor het archiveren van websites. We beheren en onderhouden het systeem en monitoren of het harvesten, de WARC webarchiefbestanden en het genereren van de checksums op rolletjes loopt.

Website archivering schaalbaar en transparant

Schaalbaar

Onze webarchivering wordt op maat aangeboden. Wilt u dagelijkse website archiverig of een andere regelmaat? Wilt u dat wij extra back-ups maken van uw WARC webarchieven of bewaard u deze na publicatie zelf? Wilt u dat wij de hele website archiveren of mogen we grote bestanden overslaan?

Laat het ons weten. We denken graag met u mee en sturen u vrijblijvend een offerte op maat.

Website archivering incrementeel en volledig

Snapshots en frequentie

Door volledige .warc archivering te combineren met incrementele .warc archivering gaan we slim om met opslagruimte. Zo kunnen we dagelijks een snapshot maken van uw website zonder een heel datacenter aan opslag nodig te hebben. Het gebruik van volledige archieven i.c.m. incrementele archieven is in overeenstemming met de 'richtlijn archiveren overheidswebsites'.

Website archief live terugkijken in browser

Live terugkijken

Het doel van website archivatie is om alle belanghebbenden laagdrempelig uw website te kunnen laten terugkijken. De .warc bestanden zijn daarvoor de aangewezen standaard, maar het gebruik daarvan vereist speciale software.

In het kader van toegankelijkheid en gemak bieden we daarom ook een interface aan waarmee men na het selecteren van een datum in de geschiedenis de opgeslagen snapshot van uw website 'live' kan browsen alsof het uw echte website was.

Bekijk voorbeelden in de lijst van gearchiveerde websites.

Onze klanten

Onze klanten zijn vooral overheidswebsites die zoveel mogelijk willen voldoen aan de Richtlijn archiveren overheidswebsites c.q. aan de Archiefwet 1995.