Mikrofon - Sound Datei- automatisch Spracherkennung in Text speichern

  • Hallo Community

    Das Ziel ist es mit einem Mikrofon eine Aufzeichnung zu erstellen. Ich vermute, dass wegen der Distanz von 10meter und wehendem Wind die meisten normalen Mikrofone nicht ausreichen, deswegen ein Richtmikrofon benötigt wird. Könnt ihr da welche Empfehlen?

    Doch vor allem, soll dann die AudioDatei automatisch analysiert werden. Bei Überwachungskameras gibt es die Funktion der Bewegungserkennung.

    Gibt es so etwas auch bei Sound-Dateien? Ich stelle mir vor, dass Sprache erkannt wird und am besten noch in Text umgewandelt wird. Also am Ende eine TXT Datei mit dem erkannten Wörtern.

    Könnt ihr mir mit einigen Impulsen weiterhelfen Gibt es schon ähnliche Projekte?

  • Mikrofon - Sound Datei- automatisch Spracherkennung in Text speichern? Schau mal ob du hier fündig wirst!

  • @DeutscheBank

    Ich will mich mal diplomatisch ausdrücken aber du bewegst dich mit deinem Vorhaben zumindest in einer "Grauzone".

  • Um sowas zielgerichtet auszuwerten, wirst Du im ersten Schritt zur Aufbereitung der Audiodaten um eine geschmeidige Fouriertransformation nicht herumkommen :lol:

    Viel Spaß!

  • Frag mal Huawei, besser den Chef Xi Jinping. Da wird dir geholfen. :elektro:. ux-0

    Na, wieder das China-bashing aus der Mottenkiste geholt? 5 eyes, NSA & Co sind ja die Guten im Holzschnittartigen Weltbild ?

  • Du bist nicht der einzige, der aus seiner Angst vor Corona in anti-chinesische ressentiments verfällt. Befindest dich da in guter Gesellschaft zB mit einem “stable genius” aus den USA. Das mit ein bisschen vermeintlicher Regimekritik zu verbrämen ist durchsichtige Rechtfertigung...

    • Offizieller Beitrag

    Ist irgendwie irre dieser Thread hier. Ein User namens "DeutscheBank" fragt nach einer brauchbaren Lösung für eine Stasi-Arbeitsweise und ein anderer User dreht am Sender ind schreibt tatsächlich "Kommunistische-Nazis". :dau1:

    unimatrix-0 Zweite und letzte Warnung! Die nächsten Beiträge dieser Art werden von mir als Spam betrachtet und gelöscht.

  • Hallo "Deutsche Bank",

    unabhängig vom Status der Legalität Deiner Idee: Ich habe 2014 eine Anwendung entwickelt, in der ein Anwender in ein Mikrophon spricht, die Sprache in Text umgewandelt wird, der Text entweder als Kommando zur Sprachsteuerung von Computersystemen bzw. anderer Software verwendet werden kann oder der Text in anderen Sprachen übersetzt wird und über Lautsprecher ausgegeben werden kann.

    Texte beider Sprachen sowie die Sound-Daten können in Dateien gespeichert werden.

    Der Abstand vom sprechenden Mund zum Mikrophon entspricht dem eines Headsets. Das heißt der Sprecher weiß, was mit seinen gesprochenen Worten passiert und kann direkt Aktion und Reaktion beobachten.

    Bei Deiner Idee bin ich mir da aber nicht sicher.

    Als Antwort auf Deine Frage: Ja, es gibt eine Lösung. Ja, sie lässt sich sogar recht leicht programmieren (zumindest war das 2014 so).

    Aber auch: Nein, bei Projekten, die offensichtlich nicht legalen Zwecken dienen (könnten), wirst Du in diesem Forum keine Unterstützung finden.


    Deswegen ist für mich eine weitere Beschäftigung mit dieser Thematik beendet.


    Beste Grüße

    Andreas

    Ich bin wirklich nicht darauf aus, Microsoft zu zerstören. Das wird nur ein völlig unbeabsichtigter Nebeneffekt sein.
    Linus Torvalds - "Vater" von Linux

    Linux is like a wigwam, no windows, no gates, but with an apache inside dancing samba, very hungry eating a yacc, a gnu and a bison.

    Einmal editiert, zuletzt von Andreas (14. August 2020 um 14:00)

  • Danke für eure Antworten.

    Ich habe verstanden.

    Unabhängig davon, werft ihr mir alle etwas Illegales vor. Das ist nicht meine Absicht und wie es scheint ein Missverständnis.

    Die anderen Abschweifungen und auch mein Namen lass ich hier mal unkommentiert. =)

    Danke, dass ihr es nicht einfach gesperrt habt sonder mich noch antworten lasst.

    • Offizieller Beitrag

    unimatrix-0 Ich möchte einfach nur, dass Du mit diesem Thema (China) hier im Forum aufhörst. Wenn Du Dich nicht zurückhalten kannst und unbedingt Deinen Senf zu China loswerden willst, dann such Dir eine andere entsprechende Plattform im Netz, aber hier im Forum bitte nicht mehr! Tu mir bitte den Gefallen!

    Beiträge zu löschen ist ein Mehraufwand für mich und ich hab eigentlich keine Lust dazu mich damit zu beschäftigen.

  • Ich bin im Hospiz Dienst tätig.

    Ein Diktiergerät muss immer langwierig durchsucht werden. Deswegen die Umwandlung von Audio zu Text. Und auch nur die erkannten Wörter / Sätze.

    Pflegebedürftig und im Bett lebend.

    Wie es scheint, habe ich mit dem Mikrofon übertrieben. Es hallt und er ist auch sehr leise. Deswegen dachte ich einfach nur an ein sehr gutes Mikrofon. (Sowas dachte ich. https://www.amazon.de/KEEPDRUM-Richtmikrofon-Zubeh%C3%B6rset-Windschutz-MC-025XJ/dp/B00X7HFGDY?tag=psblog-21 [Anzeige]) Wie die Journalisten vom Fernseher.

    Es ist eine Loft Wohnung. Das Bett wird regelmässig auf das begehbare Dach geschoben. Dort sind Pflanzen und Möbel. Dachte das man das Gerät in der Wohnung lässt und durch den Eingang surichtet. Aber jetzt wo ich darüber nachdenke, könnte man es auch an das Bett befestigen.

    Einen Großteil der Pflege übernimmt die Familie.

  • Ja es geht hier um die "Überwachung" von Pflegebedürftigen, soweit habe ich das aber verstanden. Das Problem mit der Sprachsoftware ist aber die, sobald gesprochene Wörter oder Videobilder...etc ohne Einverständnis des zu überwachenden gespeichert werden, befindet man sich in einer "Grauzone" um es wieder mal "diplomatisch" auszudrücken.

  • OK, lassen wir das lieber.

    Derjenige der seit 7 Jahren Querschnitt gelähmt ist, ist damit einverstanden. Es gibt Wachzeiten da kann er sich verständigen.

    Da war die Idee, dass man dann seine Gedanken und Wünsche zu einem Späteren Zeitpunkt erkennen kann.

  • Wenn es darum geht, dass wenn die Person etwas haben möchte, würde ich eine Alexa nehmen und ggf. mit NodeRed verbinden um z.B. eine Message über Telegram zu bekommen.

    Bei meinen Großeltern habe ich einen Echo Dot Gen3 im Einsatz und ihn mit NodeRed verknüpft. NodeRed übernimmt dann Aufgaben wie Messages über Telegram aufs Handy oder ins eigene Smarthome zu senden. Bei einem Notfall und Alexa wird duch (alexa notfall) ausgelöst, klingelt die Klingel im Haus die SOS Töne und jeder aus der Familie bekommt eine Nachricht aufs Handy.

    Was mir gerade eingafellen ist.

    Evtl. kann man über den Payload der Nachricht von Alexa die Google Speech to Text API ansprechen und die Nachricht dann per Telegram aufs Handy bekommen.

    Edit: Hab den letzten Beitrag 20sec nach absenden erst gelesen :)

  • Müsste "nur noch" der Teil mit der Sprachsoftware erledigt werden.

    Wobei ein Mensch nicht die Rechte an seinem gesprochenen Wort verliert, nur weil er pflegebedürftig ist.

    Auch nicht im häuslichen Umfeld.

    Eine Aufzeichnung und Auswertung... ohne dem Willen und Wissen derjenigen Person liegt auch nicht mehr im Bereich einer Grauzone, sondern ist strafbar und hochgradig kriminell.

    Das kann man auch nicht damit begründen, dass man im Notfall schnell helfen will, da ja alle Aufzeichnungen, Texte.... erst einmal ausgewertet werden müssen. Dann ist eine Hilfe eh zu spät.

    Das mit dem Babyphone ist in dem Fall noch vertretbar, da so eine möglichst schnelle Hilfe möglich ist.

    :2cents:

  • Wäre auch eine Idee, zumal ja die Echo Dots auch "Farfield Microphones" verbaut haben.

Jetzt mitmachen!

Du hast noch kein Benutzerkonto auf unserer Seite? Registriere dich kostenlos und nimm an unserer Community teil!