936ebc2f56
Scan-/bildbasierte PDFs werden jetzt von Files-MCP (read_file) UND Mail-MCP (read_attachment) ueber das gemeinsame Modul pdfutil.py verarbeitet: Seiten via PyMuPDF als PNG (150dpi, max 20) + OCR-Text (tesseract deu+eng). Verschluesselte/ kaputte PDFs bleiben graceful. Deps: pymupdf, pytesseract (+ system tesseract-ocr). 76 Tests gruen.
10 lines
150 B
Plaintext
10 lines
150 B
Plaintext
httpx==0.28.1
|
|
httpx-sse==0.4.3
|
|
mcp==1.27.2
|
|
openpyxl==3.1.5
|
|
pdfplumber==0.11.9
|
|
pillow==12.2.0
|
|
PyMuPDF==1.27.2.3
|
|
pytesseract==0.3.13
|
|
python-docx==1.2.0
|