Webarchivaris Webarchivaris

Doorzoekbaar webarchief (full-text zoeken)

Full-text zoeken met Whoosh

Voor het zoeken bouwen wij per website een full-text index op met Whoosh. Daarin staat de volledige tekstinhoud van de gearchiveerde pagina's, zodat u op elk woord kunt zoeken dat ergens in het archief voorkomt. U typt een zoekterm en krijgt direct de pagina's terug waarin die term voorkomt — vergelijkbaar met zoeken in een gewone zoekmachine, maar dan binnen uw eigen archief.

Een index per website

Elke gearchiveerde website krijgt een eigen index. Daardoor blijven de zoekresultaten zuiver en overzichtelijk: u doorzoekt precies één website tegelijk, zonder dat resultaten van andere sites of organisaties ertussendoor komen. Dat past ook bij de strikte scheiding tussen organisaties op het platform.

Zoeken over incrementele opnamemomenten

De zoekfunctie reikt over de tijd heen. Omdat wij incrementeel archiveren, bouwt zich een keten van opnamemomenten op. De full-text index dekt die hele keten, zodat u ook tekst terugvindt die op een eerder moment op de website stond maar inmiddels is gewijzigd of verwijderd. Zo achterhaalt u niet alleen óf iets ooit gepubliceerd is, maar ook wanneer.

Van zoekresultaat naar de gearchiveerde pagina

Vanuit een zoekresultaat opent u de bijbehorende momentopname rechtstreeks in de replay-omgeving en bekijkt u de pagina precies zoals die er destijds uitzag. Zoeken en terugkijken werken zo naadloos samen.

Lees ook hoe het terugkijken in de replay-omgeving werkt, wat een .warc-archief is en bekijk ons archiveringsplatform.