Webarchivaris.nl
Voor compliancy, de Archiefwet en preservering.

Over 10 - dagen, maanden of jaren - terugkijken naar uw website van nu? Geen probleem.


Website archivering

Wij verzorgen website archivering met een archiveringsvoorziening die voldoet aan de technische eisen uit de richtlijn archiveren overheidswebsites. Inclusief harvesten, archiveren, opslag en functie om bewaarde pagina's live terug te kijken.

Onze innovatieve op Chromium gebaseerde crawler legt uw website precies vast zoals bezoekers hem zien en bewaart de snapshots in een .warc archief. Zo archiveren we uw website. Via onze webmodule kunt u bewaarde archieven bekijken. Laat ons uw website archiveren!

Logo Webarchivaris

Website laten archiveren

Archiefwet 1995 / richtlijn archiveren overheidswebsites.

Laat ons uw website archiveren. Onze website archieven voldoen aan de eisen uit de Richtlijn archiveren overheidswebsites c.q. de Archiefwet 1995 en onze .warc files conformeren aan ISO 28500. We bieden een aantrekkelijk totaalpakket zodat u niet zelf de kennis en IT in huis hoeft te halen die nodig is voor website archivering.

Snapshot frequentie

We kunnen uw website archiveren op een door u bepaald ritme. Dagelijks, wekelijks, maandelijks of (half)jaarlijks. Via een interface is kan men elke snapshot terugkijken of de archieven downloaden als .warc bestand.

Kosten van website archivering

De kosten voor het archiveren zijn afhankelijk van de complexiteit en de grootte van uw website in combinatie met de frequentie van archivering. We brengen graag vrijblijvend een offerte uit.

Kosteneffectief uw website laten archiveren voor de Archiefwet? Neem snel contact op .

Terugkijken: hoe?

U kunt de website archieven op 2 manieren benaderen.

1) Live terugkijken via onze web interface.
Kies een datum en zie hoe de website er op die dag uit zag. U kunt zelfs browsen tussen de verschillende pagina's alsof het een live website is. Bekijk bijvoorbeeld de datumkiezer van Regio Hart van Brabant.

2) Door .warc archieven bladeren / downloaden

Bekijk alle .warc archieven die er gemaakt zijn. Klik op het gewenste jaartal, de maand en de dag. Vervolgens kunt u alle archieven van dat moment downloaden. Bijvoorbeeld om ze op uw eigen systeem te bewaren of bekijken. Blader bijvoorbeeld door de archieven van Regio Hart van Brabant.


Naast deze 2 opties kunt u als opdrachtgever ook via FTP alle .warc bestanden tegelijkertijd downloaden, bijvoorbeeld om ze in een ander archief weer te uploaden of voor een eigen back-up. Hierdoor bent u niet van ons afhankelijk als u wilt overstappen.

Waarom website archivering?

Overheid

De overheid publiceert steeds meer besluiten, bekendmakingen en informatie digitaal. Burgers die naar aanleiding hiervan actie ondernemen of juist iets nalaten moeten altijd kunnen terugvallen op wat er op dat moment gepubliceerd was, ongeacht latere aanpassingen. Elke versie van zo'n digitale publicatie moet dus gearchiveerd worden.

Banken en (semi) publieke organisaties

Ook voor veel banken en (semi) publieke organisaties geldt dat gepubliceerde informatie vindbaar moet blijven. Ook wanneer de informatie niet meer op uw website gepubliceerd is. Dat kan bijvoorbeeld via onze archieffunctie i.c.m. terugkijken via onze web interface.

Conservatie / cultuur en erfgoed

Voor andere websites geldt dat het niet wettelijk verplicht is om te archiveren maar dat conservatie wel wenselijk is. Bijvoorbeeld in het geval van cultuur en erfgoed. U kunt daarom ook bij ons terecht voor het conserveren van websites.


De technische kant van website archivering

Met website archivering maken we periodiek een snapshot van uw gehele website. Hiervoor ontdekt en bezoekt onze op Chromium gebaseerde webcrawler alle pagina's op uw website. Hij scrollt zelfs naar beneden op uw pagina's zodat ook dynamische elementen geladen worden. De pagina's worden vervolgens inclusief alle noodzakelijke bestanden bewaard in een speciaal .warc bestand; dat is de standaard op het gebied van website archivatie waarmee ondermeer ook metadata, requests en serverresponses worden opgeslagen.

De .warc website archieven worden direct na het aanmaken digitaal ondertekend met een MD5 checksum en vervolgens ongecomprimeerd opgeslagen en gepubliceerd. De bestandsnamen en mapindeling maken maken zoeken makkelijk. Iedereen kan de .warc bestanden rechtstreeks downloaden of met onze voorziening 'live' over uw website browsen zoals deze op de gekozen datum op het internet stond. Het doel is om u te helpen te voldoen aan de Wet Archivering 1995 en de richtlijn archiveren overheidswebsites.

Uw website laten archiveren of conserveren? Vraag vrijblijvend een offerte op.


Implementatie

Voor elk CMS

Onze webarchivering is te implementeren ongeacht het CMS op uw site. Onze harvestingdienst bezoekt uw website zoals een normale bezoeker.

Automatisering

Automatisering

Geheel automatisch wordt er dagelijks een kopie van uw hele website gemaakt. Deze wordt omgezet naar het .warc formaat, ondertekend en ter beschikking gesteld.

Opslag

Opslag

Alle data blijft in Nederland; wij gebruiken een opslagplatform in het TransIP DCG datacenter te Amsterdam gecombineerd met een optionele NL offsite back-up.

Systeem

Systeem

Ons platform staat bij het bewezen betrouwbare TransIP en werkt op Linux, Btrfs en diverse open-source componenten. Zo houden we alles in eigen hand en verlagen we de kosten.

Veiligheid

Veiligheid

Wij harvesten enkel openbaar gepubliceerde informatie. De .warc bestanden worden digitaal ondertekend met een MD5 checksum. Afhankelijk van uw keuze maken we ook back-ups.

Functies

Functies

Dagelijkse harvest, geen compressie, .warc ISO 28500, uniforme bestandsnamen, checksums, alle requests en responses, 1GB warc files, CDX index, webinterface met datumkiezer.

Archiefwet / richtlijn archiveren overheidswebsites

Puntsgewijs door de gestelde eisen

Onze website archiveringsdienst voldoet aan de onderstaande eisen uit de richtlijn archiveren overheidswebsites:

Dagelijkse harvest

Eens per maand wordt uw website volledig gearchiveerd in een op zichzelf staand archiefbestand. Daarna vindt dagelijks incrementele harvesting plaats waarbij alleen de wijzigingen worden opgeslagen. Zo gaan we slim om met opslag- en rekencapaciteit.

ISO 28500 WARC standaard

Archiefbestanden worden opgeslagen in de WARC standaard (conforms to ISO 28500-2008). Dit is de standaard op het gebied van website archivering. Onze WARC archieven worden gevalideerd door de tool WARCAT zoals genoemd in de Handreiking WARC-validatie voor webarchiefbestanden.

1GB archieven

Elk archiefbestand is maximaal +- 1GB groot. Als een archief in totaal groter is wordt dit gesplitst en automatisch genummerd met volgnummers. Dit is conform de aanbevelingen over bestandsgrootte in Annex C van de ISO 28500:2017 standaard.

Uniform bestandsnaampatroon

Voorspelbaar bestandsnaampatroon met uniforme naamgeving (<naam van archiefvormer>-<datum en tijd start harvest>-<volledig of incrementeel>-<domeinnaam van seed>-<volgnummer>-.warc).

Zonder compressie

Alle WARC archiefbestanden worden ongecomprimeerd opgeslagen. Dit gebruikt meer opslagruimte, maar hierdoor is er geen compressie-algoritme nodig dat over 20 jaar misschien niet meer bestaat en blijven uw archieven dus altijd toegankelijk.

MD5 checksums direct na creatie archief
Van elk WARC archiefbestand wordt na creatie direct een MD5 checksum gemaakt en vastgelegd in een begeleidend bestand waarmee de integriteit te controleren is.
Alle requests en responses
De webarchiefbestanden bevatten ongewijzigd en integraal alle requests aan de webserver en alle responses van de webserver die bij het harvesten zijn verzonden en ontvangen inclusief fouten en omleidingen.
Extra informatievelden / metagegevens

In het WARC-infoblok: software, format, robots. In de header van elk WARC-bestand: WARC-Block-Digest, content-Type, WARC-WARCinfo-ID. In de request en response-blokken: WARC-Target-URI.

ISO gecertificeerde opslag

Opslag- en rekenplatforms bevinden zich in Nederland bij TransIP. Zij hebben certificeringen voor ISO 27001:2013, NEN 7510:2017 en ISO 9001:2015.

Online terug door de tijd bladeren met datumkiezer

De geharveste content is is na harvesting direct online beschikbaar voor iedereen middels onze webinterface. Men kan door de gearchiveerde website bladeren alsof het de live website is. Hierbij wordt duidelijk aangegeven dat het om een gearchiveerde website gaat en is een datumkiezer beschikbaar om verder voor- of achteruit in de tijd te gaan.

Opdrachtgever krijgt alle rechten over archieven

U krijgt als opdrachtgever alle rechten over de archieven. Dat betekend dat u ze zelf ook kunt opslaan, verwerken en publiceren. Middels FTP leestoegang kunt u uw archieven snel downloaden om ze bijvoorbeeld zelf op te slaan, dupliceren, te kopiëren of over te brengen naar een archiefbewaarplaats.

Toegangsdienst

Bij onze harvestingdienst is een toegangsdienst inbegrepen. De gearchiveerde versies van uw website zijn in een online interface met datumkiezer te bekijken. Uw website is hierin te browsen alsof de bezoeker deze rechtstreeks bekijkt. Daarnaast worden de WARC bestanden en MD5 checksums als bestand ter download aangeboden.

U krijgt als opdrachtgever ook FTP leestoegang waarmee u al uw archiefbestanden snel en eenvoudig allemaal tegelijk kunt downloaden en opslaan. Bijvoorbeeld wanneer u uw archiefbestanden naar een archiefbewaarplaats wilt overbrengen.

Voor wie?

Onze dienst is bedoeld voor bedrijven en overheidsorganisaties die willen voldoen aan de Archiefwet 1995 c.q. de richtlijn archiveren overheidswebsites of eisen aan compliancy en preservering. Of voor website eigenaren en organisaties die webmateriaal willen laten conserveren.

De Archiefwet 1995 is van toepassing op overheidsorganen, rechtspersonen die krachtens publiekrecht zijn ingesteld of publiekelijke rechtspersonen met enig openbaar bevoegd gezag en overheidsorganen die buiten de Algemene wet bestuursrecht vallen, zoals de rechterlijke macht en de Staten Generaal.

Wij nemen webarchivering
graag uit handen

Wij hebben het uitzoekwerk al gedaan. We hebben de hardware en software al gecombineerd in een robuust platform voor het archiveren van websites. We beheren en onderhouden het systeem en monitoren of het harvesten, de WARC webarchiefbestanden en het genereren van de checksums op rolletjes loopt.

Website archivering schaalbaar en transparant

Schaalbaar

Onze webarchivering wordt op maat aangeboden. Wilt u dagelijkse website archiverig of een andere regelmaat? Wilt u dat wij extra back-ups maken van uw WARC webarchieven of bewaard u deze na publicatie zelf? Wilt u dat wij de hele website archiveren of mogen we grote bestanden overslaan?

Laat het ons weten. We denken graag met u mee en sturen u vrijblijvend een offerte op maat.

Website archivering incrementeel en volledig

Snapshots en frequentie

Door volledige .warc archivering te combineren met incrementele .warc archivering gaan we slim om met opslagruimte. Zo kunnen we dagelijks een snapshot maken van uw website zonder een heel datacenter aan opslag nodig te hebben. Het gebruik van volledige archieven i.c.m. incrementele archieven is in overeenstemming met de 'richtlijn archiveren overheidswebsites'.

Website archief live terugkijken in browser

Live terugkijken

Het doel van website archivatie is om alle belanghebbenden laagdrempelig uw website te kunnen laten terugkijken. De .warc bestanden zijn daarvoor de aangewezen standaard, maar het gebruik daarvan vereist speciale software.

In het kader van toegankelijkheid en gemak bieden we daarom ook een interface aan waarmee men na het selecteren van een datum in de geschiedenis de opgeslagen snapshot van uw website 'live' kan browsen alsof het uw echte website was.

Bekijk voorbeelden in de lijst van gearchiveerde websites.

Onze klanten

Onze klanten zijn vooral overheidswebsites die zoveel mogelijk willen voldoen aan de Richtlijn archiveren overheidswebsites c.q. aan de Archiefwet 1995.