Een bestaand webarchief overnemen (WARC-import)
Wisselt u van leverancier, dan wilt u uw bestaande webgeschiedenis meenemen. Met de WARC-import neemt Webarchivaris een bestaand archief over, ongeacht waar het nu staat — ook als het om vele terabytes gaat.
Meerdere bronnen
Omdat .warc een open standaard is (ISO 28500), kunnen we materiaal van vrijwel elke leverancier overnemen. De import haalt de bestanden uit de bron die u het beste uitkomt:
- een directe upload van uw
.warc-bestanden in delen (multipart-upload); - ophalen vanaf een externe, S3-compatibele opslag;
- een kopie rechtstreeks uit uw eigen bucket.
Manifest-gestuurd en gecontroleerd
De overname werkt op basis van een manifest: een lijst van de te importeren bestanden met hun checksums. Tijdens de import controleert het systeem elk bestand op SHA-256 en wordt identiek materiaal herkend en niet dubbel opgeslagen (dedup). Zo weet u dat alles compleet en intact is overgekomen, zonder onnodige duplicaten.
Hervatbaar, tot in de terabytes
Grote archieven kunnen tot in de terabytes lopen. De import is daarop berekend en is hervatbaar: valt een verbinding weg, dan pakt het proces de draad op waar het was gebleven, zonder alles opnieuw te beginnen. Daardoor is ook een omvangrijke leverancierswissel beheersbaar.
Na de overname
Zodra uw archief is overgenomen, valt het onder dezelfde voorziening als nieuw materiaal: terugkijken, integriteitsbewaking en ontsluiting via WebDAV, MDTO-export of overdracht aan een e-depot. Bekijk ook onze archiveringsvoorziening.
Wij nemen bestaande .warc-archieven over; oudere archieven in afwijkende of verouderde formaten beoordelen we per geval in overleg.
