Toegankelijkheid

Skip to main content

Website laten archiveren?

Wij verzorgen sinds 2011 websites voor overheden en zijn gespecialiseerd in website archivering.

Wij verzorgen sinds 2011 websites voor overheden en zijn gespecialiseerd in website archivering.

Informatie ontvangen over het archiveren van uw website?

Website archivering

Website archivering

Website archivering voor (semi) overheden, banken en organisaties.

Uitleg

Heldere informatie over het laten archiveren van uw website.

Aan de slag met website archivering

Snel aan de slag

Vul ons contactformulier in en binnen enkele dagen ontvangt u een offerte voor het archiveren van uw website.

  • NL opslag

  • ISO 28500
  • Betaalbaar
  • Open-source


Welkom

Wij bestaan sinds 2011 en weten alles van duurzame dataopslag. Met onze moderne archiveringsdienst kunt u voldoen aan de archiefwet, conservering en ontsluiting.

In een wereld vol traditionele aanbieders onderscheiden wij ons door onze progressieve aanpak. Met de kracht van open-source software zetten we nieuwe standaarden in de branche. Wij bieden u de unieke mogelijkheid om niet alleen te voldoen aan de huidige wetgeving, maar ook om de integriteit en herkomst van uw websitearchieven onweerlegbaar te verifiëren. Dit is essentieel voor echte transparantie en, ondanks het grote belang, een zeldzaamheid in de markt.

Uw website over 10, 20, of zelfs 30 jaar terugkijken? Geen enkel probleem.

Wij slaan uw websitearchieven op in publiek toegankelijke, onversleutelde bestandsformaten die de tand des tijds zullen doorstaan. Dankzij het gebruik van checksums kunt u met zekerheid vaststellen dat uw archief door de jaren heen ongewijzigd is gebleven.

  • Open-source software die u zelf kunt inzien.

  • Door moderne techniek betaalbaar.

  • Data opslag binnen Europa.

  • ISO 28500 .warc archieven

Wat is website archivering?

We leggen de basis graag even uit.

De noodzaak voor website archivering kan voortkomen uit de wettelijke eis, vastgelegd in de Archiefwet. Maar ook vanuit compliancy en preservering kunt u de behoefte hebben om uw website te laten archiveren.

Het archiveren van een website houdt in dat we naar uw keuze elke dag, week of maand een soort foto maken van uw website inclusief alle pagina's. Uw complete website wordt opgeslagen in een webarchief. Dit archiefbestand is niet aan te passen zonder dat dit zichtbaar wordt (de checksums, datums/metadata komen dan niet meer overeen). Dat betekend dat deze archiefbestanden gebruikt kunnen worden in bijvoorbeeld juridische geschillen of andere gevallen waarin men zeker moet zijn van de authenticiteit van de inhoud van het webarchief.

De webarchieven worden opgeslagen in een bestand dat door iedereen te openen is. Zo kunnen bijvoorbeeld burgers, bestuurders, ambtenaren, advocaten, rechters, officieren van justitie of journalisten elke pagina van uw website terugkijken zoals die was op het moment dat het webarchief gemaakt werd.

De opslag van webarchieven

Heel, heel veel data die betrouwbaar opgeslagen wordt.

Eén van de grootste uitdagingen voor een betrouwbare website archiveringsdienst is de opslag. Een enkel webarchief is namelijk al snel meer dan 1000MB groot. We zorgen er daarom voor dat we dit heel goed geregeld hebben.

Voor een grote website die elke dag gearchiveerd moet worden en een bewaartermijn van 10 tot 20 jaar kost dit uiteindelijk terrabytes aan data. De kunst om het beheersbaar te houden zit 'm in schaalbare opslag, het dedupliceren van dubbele data en compressie op bitniveau. Dit houdt de kosten in de hand en beperkt de complexiteit van het hardware platform.

De website archieven kunnen niet rechtstreeks gecomprimeerd worden: de archiefwet vereist dat ze zonder compressie worden opgeslagen. Op bitniveau kan dat wel en maken we optimaal gebruik van de mogelijkheden van het Btrfs en ZFS bestandssysteem. Zo kunnen we data 10, 20 of 30 jaar betrouwbaar en betaalbaar opslaan.

Webarchieven bekijken

Hoe kunt u oude webarchieven terugkijken?

Het doel van website archivering is natuurlijk om de archieven uiteindelijk ook weer te kunnen ontsluiten. Voor de archiefwet is dit stukje nauwelijks geregeld (die gaat vooral over het archiveren zelf).

Archiveren wij uw website? Dan ontvangt u van ons een link naar een openbare pagina die u naar wens op uw eigen website kunt publiceren zodat iedereen uw gearchiveerde pagina's kan terugkijken.

Dit werkt heel eenvoudig. Men navigeert simpelweg naar het gewenste jaar, de maand en de dag in een agenda-weergave.

Daarnaast ontsluiten we de .warc archieven rechtstreeks. Zo kunnen journalisten, onderzoekers en belanghebbenden de archieven controleren en ook met een eigen viewer bekijken.

Voorbeeld

Archiefbestanden downloaden

Op deze pagina ziet u bijvoorbeeld de archivering van www.regio-hartvanbrabant.nl. U kiest een dag en vervolgens ziet u direct hoe de website er toen uit zag inclusief bestanden, links en meer. U kunt ook over de website browsen.

Rechtstreeks linken naar gearchiveerde pagina's

Het gaat nog verder: als u een pagina bezoekt via de bovenstaande wijze dan kunt u die terugblik direct naar iemand doorsturen door de url in uw browser te kopiëren. Die verwijst dan naar de website, pagina en datum die u op dat moment bekijkt.

Viewer ook offline beschikbaar

U kunt onze archieven ook offline bekijken in de Replayweb viewer (downloaden voor offlinegebruik) op Windows of Mac.

Van start gaan

Hoe gaat het in zijn werk?

Nadat u contact hebt opgenomen indexeren wij uw website en schatten we in hoeveel ruimte en CPU-tijd het archiveren van uw website kost. U ontvangt vervolgens een offerte.

Na het accepteren van onze offerte kunnen we binnen enkele dagen beginnen met het archiveren van uw website. Uw website hoeft in de meeste gevallen niet aangepast te worden en we hebben geen toegang nodig tot uw CMS: we crawlen de publiek beschikbare pagina's zoals uw bezoekers uw website ook kunnen bekijken.

U ontvangt vervolgens 2 links: eentje om de gearchiveerde pagina's terug te kunnen kijken en eentje om de .warc archieven rechtstreeks te kunnen downloaden. Deze kunt u op uw website publiceren.

Details

The nitty gritty.

Opslagformaat

We kunnen archieven opslaan in het .warc formaat (ISO 28500, conform de richtlijn archiveren overheidswebsites) of .wacz (moderner formaat, inclusief zoekenfunctie).

Voor elk CMS

Onze crawler ziet de output van uw CMS, de pagina's, alsof het een bezoeker is. Het maakt dus niet uit welk CMS er achter uw website zit.

Opslag in Nederland

De primaire opslagplaats van onze webarchieven is een cloudplatform in Nederland.

Open-source systeem

Wij bouwen op Linux, ZFS, BTRFS, Browsertrix, PYWB, Replayweb, Nginx. De output is dus te reproduceren en controleren.

Gunstig geprijsd

Mede dankzij deduplicatie op bitniveau en het gebruik van open-source software kunnen we gunstige tarieven hanteren.

Integriteit & checksums

Van alle .warc archieven wordt na het genereren een checksum gemaakt en opgeslagen in een los tekstbestand in dezelfde map. De .wacz archieven hebben intern ook checksums.