feat(files): gescannte/bildbasierte PDFs als Bilder rendern (Vision)

read_file gab bei Scan-PDFs (kein extrahierbarer Text) nur nutzlose Rohbytes
zurueck -> claude.ai konnte sie nicht lesen. Jetzt: PyMuPDF rendert die Seiten
als PNG (150 dpi, max 20 Seiten) -> ImageContent, das LLM liest sie per Vision.
Verschluesselte/kaputte PDFs bleiben graceful. TestFileTypes scanned.pdf -> image.
Produktiv-Fix fuer alle User. Dep: pymupdf (requirements-extra.txt). 76 Tests gruen.
This commit is contained in:
Stefan Lohmaier
2026-06-19 08:27:08 +02:00
parent 85f5e26384
commit abeacfc3b8
4 changed files with 37 additions and 5 deletions
+8
View File
@@ -0,0 +1,8 @@
httpx==0.28.1
httpx-sse==0.4.3
mcp==1.27.2
openpyxl==3.1.5
pdfplumber==0.11.9
pillow==12.2.0
PyMuPDF==1.27.2.3
python-docx==1.2.0