Papermerge OCR Sprache Deutsch in der papermerge.conf.py

  • Moin zusammen,
    was python angeht, bin ich ein absoluter noob und frage hier mal nach Hilfe.

    Ich stehe vor folgende Problem. Ich habe Papermerge auf meinem Pi unter Docker (Porteiner) laufen. Leider hat die Papermerge Version keine Deutsche OCR Unterstützung. Was ich bis jetzt herausgefunden habe ist, dass ich in der Konsole die papermerge.conf.py Datei bearbeiten muss angeblich mit folgendem Code:

    Zitat

    OCR_DEFAULT_LANGUAGE = "deu"

    OCR_LANGUAGES = {

    "deu": "Deutsch",

    }

    LANGUAGE_CODE = "de-DE

    Ich stelle hier einmal 2 Fragen:

    1. Nutzt jemand Papermerge auf einem Pi unter Docker mit der OCR Erkennung Deutsch und kann mit sagen, wie er das eingestellt hat oder mit welchem Docker Image er arbeitet?

    2. Wie kann ich diesen Code in die papermerge.conf.py einbauen?

    Ich sage schon mal danke und freue mich auf einen Austausch.

    Sascha

    Lg

    Sascha

  • Papermerge OCR Sprache Deutsch in der papermerge.conf.py? Schau mal ob du hier fündig wirst!

  • Auf GitHub habe ich hier nun was gefunden, leider ohne Erfolg:

    https://github.com/linuxserver/do…ge-multilangocr

    This mod adds multi language OCR packages to papermerge and paperless-ng, to be installed/updated during container start.

    In papermerge/paperless-ng docker arguments, set an environment variable DOCKER_MODS=linuxserver/mods:papermerge-multilangocr to enable this mod.

    If adding multiple mods, enter them in an array separated by |, such as DOCKER_MODS=linuxserver/mods:papermerge-multilangocr|linuxserver/mods:papermerge-mod2

    Then set an environment variable named OCRLANG and set it to the language codes that follow tesseract-ocr-from this page. You can add multiple codes that are comma separated, with no spaces.

    For example, if you want to enable OCR for Chinese Simple and Belarusian, you'd set the var as -e OCRLANG="chi-sim,bel".

    Unter environment im Container habe ich versucht das oben umzusetzen:

    Leider ohne Erfolg. Jemand ne Idee?

    Lg

    Sascha

  • Hallo,

    was ist den unter papermerge/paperless-ng zu finden?

    Ich habe das nicht im Einsatz, aber da würde ich als erstes mal reinschauen, wenn ich die Zitat gelesen hab.

    Grüße

    Dennis

    🎧 With the music execution and the talk of revolution, it bleeds in me and it goes 🎧

  • was ist den unter papermerge/paperless-ng zu finden?

    Dies sind zwei unterschiedliche Anwendungen.

    Laut meiner Recherche ist paperless lange nicht aktualisiert worden. Der Entwickler von papermerge ist da mehr am Ball.

    Grundsätzlich haben beide Programme die OCR Funktion.

    Den Ordner papermerge/paperless-ng gibt es nicht.

    Lg

    Sascha

  • Hallo Sascha,

    wenn ich das richtig gelesen habe, wird für OCR bei papermerge das Programm tesseract benutzt und dort gibt es für jede Sprache ja ein eigenes Paket. Das Tesseract-Paket für Deutsch ist bei dir installiert? (für Debian / Ubuntu müsste das Paket wohl "tesseract-ocr-deu" heissen?)

    Sonst hab ich leider keine weitere Idee, da ich papermerge selbst nicht kenne.

    Gruß Martin

  • Nun habe ich die deutsche Sprache über die Konsole in Portainer eingepflegt mit folgdendem Befehl

    Code
    apt-get install tesseract-ocr tesseract-ocr-deu

    Das hat schon mal geklappt. Leider lässt sich das nicht auswählen in der Anwendung. Ich kann weiterhin nur Englisch als OCR auswählen.

    Lg

    Sascha

Jetzt mitmachen!

Du hast noch kein Benutzerkonto auf unserer Seite? Registriere dich kostenlos und nimm an unserer Community teil!