Ga naar inhoud
MIT v0.1.0 published eindgebruiker

Pipelines

De twee verwerkingspijplijnen van het platform: cognificatie (ingestie) en onderzoek (retrieval).


Twee pipelines

Het platform heeft twee hoofdpijplijnen die informatie verwerken:

flowchart LR
    subgraph Cognificatie
        A1[Document upload] --> A2[Tekst extractie]
        A2 --> A3[Analyse + NER]
        A3 --> A4[Opslag in 3 stores]
    end
    subgraph Onderzoek
        B1[Zoekvraag] --> B2[3 zoekmethoden]
        B2 --> B3[Resultaten samenvoegen]
        B3 --> B4[Gerankte antwoorden]
    end

Cognificatie Pipeline (ingestie)

De cognificatie pipeline verwerkt elk nieuw document in zes stappen:

Stap Wat gebeurt er Resultaat
1. Format detectie Bestandstype herkennen Juiste verwerkingsmethode gekozen
2. Tekst extractie Tekst uitlezen (of OCR/transcriptie) Doorzoekbare tekst
3. Taalherkenning Taal detecteren NL/EN/DE/FR geïdentificeerd
4. Entiteiten (NER) Personen, organisaties, locaties herkennen Kennisgraaf verrijkt
5. Samenvatten Korte samenvatting + trefwoorden genereren Metadata aangevuld
6. DUTO-toets Kwaliteitsscore berekenen Score 0-100%

Na verwerking wordt het document opgeslagen in drie complementaire stores:

Store Wat het bewaart Waarvoor
Relationele store Structured metadata, relaties Exacte zoekopdrachten
Vector store Betekenis-embeddings Semantisch zoeken
Graaf store Entiteiten en verbindingen Verbindingen volgen

Meer over cognificatie: Cognificatie


Onderzoek Pipeline (retrieval)

De onderzoek pipeline combineert drie zoekmethoden:

Methode Store Wat het vindt
Trefwoorden Relationele store Exacte woorden en varianten
Semantisch Vector store Betekenisverwante documenten
Graaf Graaf store Verbonden entiteiten en documenten

De resultaten worden samengevoegd en gerangschikt op:

  1. Relevantie — hoe goed het antwoord past bij uw vraag
  2. DUTO-score — hoe betrouwbaar en compleet het document is
  3. Datum — recentere documenten wegen zwaarder

Meer over zoeken: Zoeken & Vinden


Pipeline-status

Als gebruiker ziet u de pipeline-status bij:

  • Upload — voortgangsbalk tijdens cognificatie
  • Zoeken — laadtijd en resultaattelling
  • Bulk import — verwerkingsrapport met scores

Info

Pipelines draaien op de achtergrond. U hoeft niet te wachten. Na upload verschijnt het document zodra de verwerking klaar is. Bij zoeken zijn resultaten doorgaans binnen 1-2 seconden beschikbaar.


Meer informatie


Changelog

Versie Datum Wijziging
0.1.0 2026-02-24 Initiële versie — cognificatie + onderzoek pipelines, drie stores