Ga naar inhoud
MIT v0.1.0 published eindgebruiker

Ondersteunde formaten

Welke bestandsformaten het platform verwerkt, en tips per type.


Formaat-overzicht

Categorie Formaten Verwerking
Documenten PDF, PDF/A, Word (.docx), Excel (.xlsx), PowerPoint (.pptx), OpenDocument (.odt/.ods/.odp), RTF, TXT, Markdown, HTML Volledige tekst + metadata
Afbeeldingen PNG, JPG, TIFF, WebP, SVG, BMP OCR voor tekst in afbeeldingen
Audio MP3, WAV, FLAC, OGG, M4A Spraak-naar-tekst transcriptie
Video MP4, WebM, MKV, AVI, MOV Audio-extractie + transcriptie
Gestructureerd XML, JSON, CSV, RDF, YAML Schema-analyse + metadata
E-mail .eml, .mbox, .msg Headers + body + bijlagen apart
Archieven ZIP, TAR.GZ, 7Z, RAR Automatisch uitpakken + per bestand verwerken

Tips per formaat

PDF

  • PDF/A scoort de hoogste DUTO-kwaliteit (duurzaam formaat)
  • Gescande PDF's worden via OCR verwerkt — kwaliteit hangt af van de scan
  • Wachtwoord-beveiligde PDF's kunnen niet automatisch verwerkt worden

Tip

Converteer naar PDF/A. Voor duurzame opslag is PDF/A het aanbevolen formaat. De meeste kantoorapplicaties kunnen opslaan als PDF/A.

Office-documenten

  • Word, Excel en PowerPoint worden volledig geanalyseerd
  • Ingesloten afbeeldingen worden apart verwerkt via OCR
  • Macro's worden genegeerd (geen veiligheidsrisico)

Afbeeldingen

  • OCR herkent tekst in afbeeldingen (ook handgeschreven, met lagere nauwkeurigheid)
  • Hoge resolutie (300+ DPI) geeft betere OCR-resultaten
  • SVG-afbeeldingen worden als vector geïndexeerd

Audio en video

  • Spraakherkenning in Nederlands, Engels, Duits en Frans
  • Transcripties zijn doorzoekbaar als tekst
  • Verwerking van video duurt langer (afhankelijk van lengte)

Beperkingen

Beperking Waarde
Maximale bestandsgrootte 100 MB per bestand
Wachtwoord-beveiligd Kan niet automatisch verwerkt worden
Versleutelde archieven Moeten eerst ontsleuteld worden
Uitvoerbare bestanden .exe, .bat, .sh worden geweigerd

Warning

Bestanden boven 100 MB. Voor grotere bestanden (bijv. video-opnames) neem contact op met uw platform-beheerder. Grotere bestanden kunnen via een speciaal importproces verwerkt worden.


Formaat en DUTO-score

Het formaat beïnvloedt de kwaliteitsscore:

Formaat Impact op DUTO-score
PDF/A Hoog — duurzaam, standaard
PDF Goed — breed leesbaar
Word/Excel Gemiddeld — leverancier-afhankelijk
TXT/Markdown Goed — open formaat
Afbeeldingen Laag — tekst alleen via OCR beschikbaar

Meer informatie


Changelog

Versie Datum Wijziging
0.1.0 2026-02-24 Initiële versie — formaten, tips, beperkingen, DUTO-impact