Ga naar inhoud
MIT v0.1.0 published eindgebruiker

Cognificatie

Wat het systeem automatisch doet met uw documenten na upload — van 'dom' bestand naar 'slim' informatie-object.


Wat is cognificatie?

Cognificatie is het automatische verwerkingsproces dat elk geüpload document doorloopt. Het maakt een 'dom' bestand (bijv. een PDF) 'slim' door er gestructureerde informatie uit te halen.

flowchart LR
    A[Bestand] --> B[Format detectie]
    B --> C[Tekst extractie]
    C --> D[Taalherkenning]
    D --> E[Entiteiten herkennen]
    E --> F[Samenvatten]
    F --> G[Kwaliteitstoets]
    G --> H[Doorzoekbaar]

Verwerkingsstappen

1. Format detectie

Het systeem herkent automatisch het bestandstype en kiest de juiste verwerkingsmethode. Zie Ondersteunde formaten voor de volledige lijst.

2. Tekst extractie

Brontype Methode
Digitale documenten (PDF, Word, etc.) Directe tekstextractie
Gescande documenten OCR (Optical Character Recognition)
Afbeeldingen met tekst OCR
Audio/video Spraak-naar-tekst transcriptie

3. Taalherkenning

Het systeem detecteert automatisch de taal. Ondersteunde talen:

  • Nederlands (primair)
  • Engels, Duits, Frans

4. Entiteiten herkennen (NER)

Named Entity Recognition identificeert automatisch:

Entiteit Voorbeeld
Personen Functietitels, rollen
Organisaties Bedrijfsnamen, overheidsinstellingen
Locaties Steden, adressen, regio's
Datums Vergaderdata, termijnen, periodes
Bedragen Budgetten, offertes, kosten

Info

Privacy. Herkende entiteiten worden alleen opgeslagen binnen uw domein. Persoonsgegevens worden niet gedeeld met andere domeinen tenzij het informatiecontract dit expliciet toestaat.

5. Samenvatten en categoriseren

Het systeem genereert automatisch:

  • Een korte samenvatting (2-3 zinnen)
  • Trefwoorden op basis van de inhoud
  • Thema-categorisering (welke onderwerpen komen aan bod)

6. Kwaliteitstoets (DUTO)

Elk document ontvangt een DUTO-score. Zie Kwaliteitsscore voor uitleg.


Verwerkingstijd

Documenttype Typische verwerkingstijd
PDF/Word (< 10 pag.) 5-15 seconden
PDF/Word (10-100 pag.) 15-60 seconden
Afbeeldingen (OCR) 10-30 seconden
Audio (per minuut) ~30 seconden per minuut audio
Video Audio-extractie + transcriptie

Tip

U kunt doorwerken. De verwerking gebeurt op de achtergrond. U hoeft niet te wachten — het document verschijnt in uw dossier zodra de verwerking klaar is.


Resultaat controleren

Na verwerking kunt u het resultaat bekijken en indien nodig aanpassen:

  • Titel — Automatisch gegenereerd, handmatig aan te passen
  • Samenvatting — Automatisch gegenereerd, handmatig aan te passen
  • Trefwoorden — Automatisch gegenereerd, u kunt er toevoegen of verwijderen
  • Entiteiten — Automatisch herkend, u kunt onjuiste verwijderen

Meer informatie


Changelog

Versie Datum Wijziging
0.1.0 2026-02-24 Initiële versie — cognificatieproces, stappen, verwerkingstijd