MIT
v0.1.0
published
eindgebruiker
Ondersteunde formaten¶
Welke bestandsformaten het platform verwerkt, en tips per type.
Formaat-overzicht¶
| Categorie | Formaten | Verwerking |
|---|---|---|
| Documenten | PDF, PDF/A, Word (.docx), Excel (.xlsx), PowerPoint (.pptx), OpenDocument (.odt/.ods/.odp), RTF, TXT, Markdown, HTML | Volledige tekst + metadata |
| Afbeeldingen | PNG, JPG, TIFF, WebP, SVG, BMP | OCR voor tekst in afbeeldingen |
| Audio | MP3, WAV, FLAC, OGG, M4A | Spraak-naar-tekst transcriptie |
| Video | MP4, WebM, MKV, AVI, MOV | Audio-extractie + transcriptie |
| Gestructureerd | XML, JSON, CSV, RDF, YAML | Schema-analyse + metadata |
| .eml, .mbox, .msg | Headers + body + bijlagen apart | |
| Archieven | ZIP, TAR.GZ, 7Z, RAR | Automatisch uitpakken + per bestand verwerken |
Tips per formaat¶
PDF¶
- PDF/A scoort de hoogste DUTO-kwaliteit (duurzaam formaat)
- Gescande PDF's worden via OCR verwerkt — kwaliteit hangt af van de scan
- Wachtwoord-beveiligde PDF's kunnen niet automatisch verwerkt worden
Tip
Converteer naar PDF/A. Voor duurzame opslag is PDF/A het aanbevolen formaat. De meeste kantoorapplicaties kunnen opslaan als PDF/A.
Office-documenten¶
- Word, Excel en PowerPoint worden volledig geanalyseerd
- Ingesloten afbeeldingen worden apart verwerkt via OCR
- Macro's worden genegeerd (geen veiligheidsrisico)
Afbeeldingen¶
- OCR herkent tekst in afbeeldingen (ook handgeschreven, met lagere nauwkeurigheid)
- Hoge resolutie (300+ DPI) geeft betere OCR-resultaten
- SVG-afbeeldingen worden als vector geïndexeerd
Audio en video¶
- Spraakherkenning in Nederlands, Engels, Duits en Frans
- Transcripties zijn doorzoekbaar als tekst
- Verwerking van video duurt langer (afhankelijk van lengte)
Beperkingen¶
| Beperking | Waarde |
|---|---|
| Maximale bestandsgrootte | 100 MB per bestand |
| Wachtwoord-beveiligd | Kan niet automatisch verwerkt worden |
| Versleutelde archieven | Moeten eerst ontsleuteld worden |
| Uitvoerbare bestanden | .exe, .bat, .sh worden geweigerd |
Warning
Bestanden boven 100 MB. Voor grotere bestanden (bijv. video-opnames) neem contact op met uw platform-beheerder. Grotere bestanden kunnen via een speciaal importproces verwerkt worden.
Formaat en DUTO-score¶
Het formaat beïnvloedt de kwaliteitsscore:
| Formaat | Impact op DUTO-score |
|---|---|
| PDF/A | Hoog — duurzaam, standaard |
| Goed — breed leesbaar | |
| Word/Excel | Gemiddeld — leverancier-afhankelijk |
| TXT/Markdown | Goed — open formaat |
| Afbeeldingen | Laag — tekst alleen via OCR beschikbaar |
Meer informatie¶
- Documenten uploaden — Uploadproces overzicht
- Cognificatie — Wat er na upload gebeurt
- Bulk import — Grote hoeveelheden uploaden
Changelog¶
| Versie | Datum | Wijziging |
|---|---|---|
| 0.1.0 | 2026-02-24 | Initiële versie — formaten, tips, beperkingen, DUTO-impact |