Wesentliche Merkmale
- Organisiert und indexiert gescannten Dokumente mit Tags, Korrespondenten, Typen und mehr.
- Die Daten werden lokal auf (d)einem Server gespeichert und niemals übertragen oder in irgendeiner Weise weitergegeben.
- Führt OCR-Texterkennung an den Dokumenten durch und fügt durchsuchbaren und auswählbaren Text hinzu, sogar bei Dokumenten, die nur mit Bildern gescannt wurden.
- Nutzt die Open-Source-Engine Tesseract zur Erkennung von mehr als 100 Sprachen.
- Die Dokumente werden im PDF/A-Format gespeichert, das für die Langzeitarchivierung konzipiert ist, und zwar zusammen mit den unveränderten Originalen.
- Nutzt maschinelles Lernen, um die Dokumenten automatisch Tags, Korrespondenten und Dokumenttypen hinzuzufügen.
- Unterstützt PDF-Dokumente, Bilder, einfache Textdateien, Office-Dokumente (Word, Excel, PowerPoint und LibreOffice-Äquivalente) und mehr.
- Kann (auch mehrere) eMail-Konten überwachen und neue eMails (und deren Anhänge) nach Kriterien bewerten und automatisiert speichern.
- Paperless speichert die Dokumente einfach auf der Festplatte. Dateinamen und Ordner werden von Paperless verwaltet und deren Format kann frei konfiguriert werden, wobei verschiedenen Dokumenten unterschiedliche Konfigurationen zugewiesen werden können.
Mehr dazu: https://docs.paperless-ngx.com/
RasPi-Installation: https://docs.paperless-ngx.com/setup/ (Docker-Installation ist empfohlen!)