Cognificatie¶
Wat het systeem automatisch doet met uw documenten na upload — van 'dom' bestand naar 'slim' informatie-object.
Wat is cognificatie?¶
Cognificatie is het automatische verwerkingsproces dat elk geüpload document doorloopt. Het maakt een 'dom' bestand (bijv. een PDF) 'slim' door er gestructureerde informatie uit te halen.
flowchart LR
A[Bestand] --> B[Format detectie]
B --> C[Tekst extractie]
C --> D[Taalherkenning]
D --> E[Entiteiten herkennen]
E --> F[Samenvatten]
F --> G[Kwaliteitstoets]
G --> H[Doorzoekbaar]
Verwerkingsstappen¶
1. Format detectie¶
Het systeem herkent automatisch het bestandstype en kiest de juiste verwerkingsmethode. Zie Ondersteunde formaten voor de volledige lijst.
2. Tekst extractie¶
| Brontype | Methode |
|---|---|
| Digitale documenten (PDF, Word, etc.) | Directe tekstextractie |
| Gescande documenten | OCR (Optical Character Recognition) |
| Afbeeldingen met tekst | OCR |
| Audio/video | Spraak-naar-tekst transcriptie |
3. Taalherkenning¶
Het systeem detecteert automatisch de taal. Ondersteunde talen:
- Nederlands (primair)
- Engels, Duits, Frans
4. Entiteiten herkennen (NER)¶
Named Entity Recognition identificeert automatisch:
| Entiteit | Voorbeeld |
|---|---|
| Personen | Functietitels, rollen |
| Organisaties | Bedrijfsnamen, overheidsinstellingen |
| Locaties | Steden, adressen, regio's |
| Datums | Vergaderdata, termijnen, periodes |
| Bedragen | Budgetten, offertes, kosten |
Info
Privacy. Herkende entiteiten worden alleen opgeslagen binnen uw domein. Persoonsgegevens worden niet gedeeld met andere domeinen tenzij het informatiecontract dit expliciet toestaat.
5. Samenvatten en categoriseren¶
Het systeem genereert automatisch:
- Een korte samenvatting (2-3 zinnen)
- Trefwoorden op basis van de inhoud
- Thema-categorisering (welke onderwerpen komen aan bod)
6. Kwaliteitstoets (DUTO)¶
Elk document ontvangt een DUTO-score. Zie Kwaliteitsscore voor uitleg.
Verwerkingstijd¶
| Documenttype | Typische verwerkingstijd |
|---|---|
| PDF/Word (< 10 pag.) | 5-15 seconden |
| PDF/Word (10-100 pag.) | 15-60 seconden |
| Afbeeldingen (OCR) | 10-30 seconden |
| Audio (per minuut) | ~30 seconden per minuut audio |
| Video | Audio-extractie + transcriptie |
Tip
U kunt doorwerken. De verwerking gebeurt op de achtergrond. U hoeft niet te wachten — het document verschijnt in uw dossier zodra de verwerking klaar is.
Resultaat controleren¶
Na verwerking kunt u het resultaat bekijken en indien nodig aanpassen:
- Titel — Automatisch gegenereerd, handmatig aan te passen
- Samenvatting — Automatisch gegenereerd, handmatig aan te passen
- Trefwoorden — Automatisch gegenereerd, u kunt er toevoegen of verwijderen
- Entiteiten — Automatisch herkend, u kunt onjuiste verwijderen
Meer informatie¶
- Documenten uploaden — Uploadproces overzicht
- Formaten — Ondersteunde bestandsformaten
- Bulk import — Grote hoeveelheden verwerken
- Kwaliteitsscore — DUTO-scores begrijpen
Changelog¶
| Versie | Datum | Wijziging |
|---|---|---|
| 0.1.0 | 2026-02-24 | Initiële versie — cognificatieproces, stappen, verwerkingstijd |