Doorzoekbaar webarchief (full-text zoeken)
Een groot archief is alleen bruikbaar als u snel de juiste pagina terugvindt. Daarom is uw webarchief volledig doorzoekbaar: u zoekt full-text op woorden en zinnen door de complete gearchiveerde paginatekst — niet alleen op titels of adressen.
Full-text zoeken met Whoosh
Voor het zoeken bouwen wij per website een full-text index op met Whoosh. Daarin staat de volledige tekstinhoud van de gearchiveerde pagina's, zodat u op elk woord kunt zoeken dat ergens in het archief voorkomt. U typt een zoekterm en krijgt direct de pagina's terug waarin die term voorkomt — vergelijkbaar met zoeken in een gewone zoekmachine, maar dan binnen uw eigen archief.
Een index per website
Elke gearchiveerde website krijgt een eigen index. Daardoor blijven de zoekresultaten zuiver en overzichtelijk: u doorzoekt precies één website tegelijk, zonder dat resultaten van andere sites of organisaties ertussendoor komen. Dat past ook bij de strikte scheiding tussen organisaties op het platform.
Zoeken over incrementele opnamemomenten
De zoekfunctie reikt over de tijd heen. Omdat wij incrementeel archiveren, bouwt zich een keten van opnamemomenten op. De full-text index dekt die hele keten, zodat u ook tekst terugvindt die op een eerder moment op de website stond maar inmiddels is gewijzigd of verwijderd. Zo achterhaalt u niet alleen óf iets ooit gepubliceerd is, maar ook wanneer.
Van zoekresultaat naar de gearchiveerde pagina
Vanuit een zoekresultaat opent u de bijbehorende momentopname rechtstreeks in de replay-omgeving en bekijkt u de pagina precies zoals die er destijds uitzag. Zoeken en terugkijken werken zo naadloos samen.
Lees ook hoe het terugkijken in de replay-omgeving werkt, wat een .warc-archief is en bekijk ons archiveringsplatform.
