Überprüfen und ergänzen von Satzzeichen

  • Problem 4


    in meinem Program wird per Aufnahme ein Text erstellt allerdiengs ohne Punkt und andere Satzzeichen.



    Damit die übersetzung aber halbweg vernünfig wird müssen Satzzeichen passen, so hoffe ich das mir jemand helfen kann wie man den Text die Satzzeichen anpassen kann.

  • Hallo MCSITK,


    da wäre ich skeptisch, dass das, was Du Dir vorstellst sooo einfach umzusetzen wäre.


    Du hast einen Stream, der in Text umgewandelt wird.
    Sprechpausen, aus denen "Komma", "Semikolon", "Punkt" ermittelt werden könnten, kannst Du nur durch Analyse des (Sound-)Streams erhalten. Wenn das gelänge, müsstest Du aber auch den Stream auswerten, damit Du weißt, an welcher (Text-)Stelle welche Pause zu einem Wortwechsel, Einbau von "Komma", "Semikolon" oder "Punkt" führen soll.

    Wenn das mit großem Aufwand gelänge: Wie soll die Pause gestaltet sein bei "Doppelpunk", "Klammer auf", Klammer zu"? Es gibt runde, eckige und geschweifte Klammern... "Ausrufezeichen", "Anführungszeichen", "Fragezeichen"...


    Warum willst Du Dir die Arbeit schwerer machen, d.h., mehr bieten als es automatische Übersetzungsprogramme machen / können?


    Da ist es vollkommen legitim, an den passenden Stellen einfach zu sagen "Punkt Neue Zeile" oder "Punkt Absatz". Wie bei einem Diktat.


    Dann müsstest Du nur noch einen kleinen Parser programmieren, der alle ausgesprochenen Satzzeichen durch die Satzzeichen ersetzt, damit der Übersetzungsteil korrekt gespeist werden kann.


    Mach' Dir aber keine große Hoffnung: Die typischen deutschen Schachtelsätze und Nebensätze bekommst Du durch automatische Übersetzung nur ganz selten aufgelöst.



    Beste Grüße


    Andreas

    Ich bin wirklich nicht darauf aus, Microsoft zu zerstören. Das wird nur ein völlig unbeabsichtigter Nebeneffekt sein.
    Linus Torvalds - "Vater" von Linux

    • Icon-Tutorials (IDE: Geany) - GPIO-Library - µController-Programmierung in Icon! - ser. Devices - kein Support per PM / Konversation

    Linux is like a wigwam, no windows, no gates, but with an apache inside dancing samba, very hungry eating a yacc, a gnu and a bison.

  • hyle

    Changed the title of the thread from “Überprüfen und ergenzen von Satzzeichen” to “Überprüfen und ergänzen von Satzzeichen”.
  • Hallo,


    ich sehe das auch als schwierig an. Zumal es ja auch Sätze gibt, wo ein Satzzeichen den Sinn verändert, wie der Klassiker:

    "Komm' wir Essen, Opa" vs. Komm' wir Essen Opa".


    Plus aus dem reinen Text ist es schwierig "herauszulesen", ob es ein langer Schachtelsatz ist oder ggf. zwei oder drei Sätzen. Beim reinen Zuhören macht das ja keinen wirklichen Unterschied, da bekommt man den Kontext i.d.R. hin.


    Gruß, noisefloor

  • Ich will ja damit keine grosßen komplexe Sätze schreiben, sonders legentlich normale Standartsätze. Und der sinn ist es das es kein , wie einem Diktiergerät, dem alles sagen muss, sondern aus der unterhaltung es aufnimmt.

    Also sowas wie ein Universalübersetzer aus Startek , nur in ein viel einfacher und realistischer form


    Später vieleicht wenn ich mal soweit sein sollte könnte man das mit den Satzzeichen eine KI übelassen

  • Das einzige was mir jetzt einfällt ist, du könntest den Text nehmen und an die DeepL API senden um ihn übersetzen zu lassen um so an die Satzzeichen zu kommen. https://pypi.org/project/deepl/

    Eventuell bieten auch Gramatiktools wie LanguageTool eine API an, wo du den Text prüfen kannst.

    Das nur mal als Ideenvorschlag, selbst programmieren seh ich hier aber keine Chance (vorallem nicht im "Hobbybereich")

  • an die DeepL API senden um ihn übersetzen zu lassen um so an die Satzzeichen zu kommen.

    Klappt leider schon mit blossem Tippen nicht.


    Ich sehe wirklich keine Chance, dass das mit selbst mittelschweren Aufwand zu erreichen ist.

    Der Unterschied zwischen Genie und Wahnsinn definiert sich im Erfolg.

  • Mir ist schon klar , das ohne KI Unterstützung nicht wirklich klappt, da Betohnungen , Satzpausen und Tohnhöhe Veränderung , die auswahl der Satzzzeichen verändern. Mir ist schon klar das wie dden vorher genannten Beispiel satz "Komm wir essen Opa" nicht wirklich gemeint war als Humoristische Floskel zb


    Wie auch immer . Wäre aber ein Projekt vieleicht wert :) aber dafür hab ich zuwenig KI erfahung, naja eigentlich keine