Spracherkenung

L I V E Stammtisch ab 20:30 Uhr im Chat
  • Hallo,

    ich probiere schon tagelang eine funktionierende Spracherkennung auf mein Raspberry pi 3 hinzubekommen. Bis jetzt ohne erfolg :(
    Ich habe die Software PiAUlSuite bzw. Jasper probiert.

    PiAulsuiit:

    Nachdem ich die Kommandos

    Code
    git clone git://github.com/StevenHickson/PiAUISuite.git
    cd ~/PiAUISuite/Install/
    sudo ./InstallAUISuite.sh


    ausgeführt hatte, konnte man die verschiedenen Pakete installieren.
    Ich habe nur die benötigten Abhängigkeit sowie voicecommand installiert.
    Nach der Installation von Voicecommand und der Bestätigung zum einrichten kam schon der erste Fehler :(

    Code
    voicecommand: error while loading shared libraries: libboost_regex.so.1.49.0: cannot open shared object file: No such file or directory

    Um dieses Problem zu Lösen, habe ich durch Google folgende Lösung gefunden:
    https://www.raspberrypi.org/forums/viewtop…=72570&p=522791
    Letzter Beitrag.

    danach nochmal

    Code
    voicecommand -s


    ausgeführt.
    Bei der Frage

    Code
    Do you want to set up and check the text to speech options?


    wo ich nach den Bestätigen etwas hören sollte, höre ich einfach nix :(

    Habt Ihr eine Idee?

    Die Installation von Jasper bekomme ich einfach unter mein pi3 mit Jessie Betriebssystem nicht hin :(
    Geht Jasper überhaupt unter Jessie?

    Ich benutze eine USB Soundkarte, welches ich nach der Anleitung [Tutorial] MPD und USB Soundkarte unter Raspbian Jessie einrichten installiert habe. Mittels "Speaker-test" höre ich auch ein Brummen aus meinen Lautsprecher. Das angeschlossene Mikrofon über die USB Soundkarte funktioniert auch.

    Gibt es eventuell auch noch Alternativen neben PiAULSuite und Jasper?

    Freue mich auf eure Antworten.
    Ein schönen Abend
    PCGamer8

  • ich gehe nach der Anleitung von hier vor: https://jasperproject.github.io/documentation/installation/

    Bei den Punkt "Build Phonetisaurus" bricht er ab

    C
    root@raspberrypi:~/jasper/cmuclmtk/is2013-conversion/phonetisaurus/src# sudo make
    g++ -O2 -I3rdparty/sparsehash -I3rdparty/utfcpp    -c Phonetisaurus.cpp -o Phonetisaurus.o
    Phonetisaurus.cpp:34:24: fatal error: fst/fstlib.h: No such file or directory
    #include <fst/fstlib.h>
                           ^
    compilation terminated.
    Makefile:51: recipe for target 'Phonetisaurus.o' failed
    make: *** [Phonetisaurus.o] Error 1


    :(

    Was ist den da falsch?

    Wie kann ich PiAULSuite wieder deinstallieren?

  • Von Google Speech für die passive Erkennung rate ich dir dringend ab. Dann wird nämlich jede Unterhaltung, die du führst zu Google übertragen.

    Ich nutze momentan für die passive Erkennung Snowboy. Kann später mehr dazu sagen, wenn ich daheim bin.

    Für die aktive Erkennung nutze ich auch Google, weil es einfach am besten ist. Aber das mit der Privatsphäre solltest du im Hinterkopf haben

  • Ich denke das kann jeder für sich entscheiden. Wenn man Siri oder Google Now, ... nutzt gehen alle Daten auch über die Server der jeweiligen Firma.
    Ich meine nur das die Google Speech API am besten funktioniert.

  • Hi

    ich hab noch einen Pi hier liegen der dafür verwendet werden soll wenn mein AQ Pi alles so macht wie er es soll. Hatte auch diverse Gits versucht, aber ich hab mir die kompletten Audioeinstellunge zerschossen und erstmal abgebrochen. Gestern bin ich hier drüber gestolpert -> https://www.indiegogo.com/projects/matri…tform-for-all#/

    Das sieht mir interessant aus und funktioniert angeblich auch ohne Cloud im Hintergrund, also auch offline. Ich mag Alexa, Siri, Cortana nicht wirklich und will einen eigene Lösung implementieren. Das Matrix hab ich schon gecrowded, warte auf die Auslieferung. Das Ding wird interessant werden, bin schon ganz aufgeregt und überleg schon was für ein Gehäuse ich da im 3D Drucker für basteln werde.

  • Hi

    vorweg ich habe wenig ahnung.

    Mit jasper und co kann ich dir nciht wirklich weiterhelfen... ich bin auch daran gescheitert. Mit der folge das ich mein eigenen assisten aufbaue.... ich nehm pocketsphinx mit franzoesischer sprache und versuch es mit python... als mic kann ich das ps3eye empfehlen das gibt es ab 6 euro
    ich poste dir einfach mal meine notes


  • Ich habe mich erstmal für die Google API entschieden. Dazu verwende ich folgendes Script: https://github.com/codeispoetry/Speechrecognition

    Leider kommt in der Konsole folgende Fehlermeldung:

    Weiß jemand wo da der Fehler liegt?

  • Ich habe jetzt den Link angepasst. Jetzt kommt aber

    Code
    https://translate.google.com/translate_tts?tl=de&q=Bitte: No such file or directory

    Wenn ich die URL im Browser eingebe kommt zuerst eine Captchaeingabe und dann page not found.

    Gibt es irgendwo ein funktionierendes Script welches am besten ein Rückmeldung gibt und einfach erweitern lässt?
    habe das gefunden: https://tutorials-raspberrypi.de/raspberry-pi-s…g-selbst-bauen/
    Dort muss aber mit Strg+C die Aufnahme beendet werden und es gibt leider auch keine (Stimmliche) Rückmeldung.

    An meinen Raspberry soll später keine Tastatur und kein Bildschirm vorhanden sein. Aus diesem Grund wäre das oben genannte Script geeignet gewesen (wenn es funktioniert)

  • Hallo zusammen,

    ich hatte mal ein Übersetzungstool programmiert (Spracheingabe in Sprache X, Speech-to-Text, Übersetzen in Sprache Y, Text-To-Speech), das auf der Google-API aufsetzt. Ca. 2 Monate nach Fertigstellung darf man diese Google-API nur noch als eingetragener Entwickler nutzen. Dem Aurfuf ist dann User und Passwort zu übergeben.

    Nach 3 gescheiterten Versuchen, sich bei Google als Entwickler registireren zu lassen, habe ich es aufgegeben.

    Beste Grüße

    Andreas

    Ich bin wirklich nicht darauf aus, Microsoft zu zerstören. Das wird nur ein völlig unbeabsichtigter Nebeneffekt sein.
    Linus Torvalds - "Vater" von Linux

    Linux is like a wigwam, no windows, no gates, but with an apache inside dancing samba, very hungry eating a yacc, a gnu and a bison.

  • Hi, ich habe die Sprachsteuerung VoiceCommand von Steven Hickson zum Laufen gebracht. Für dein Problem gibt es eine einfache Lösung. Einfach folgenden Befehl ausführen:

    Code
    ln -s /usr/lib/x86_64-linux-gnu/libboost_regex.so.1.55.0 /usr/lib/x86_64-linux-gnu/libboost_regex.so.1.46.1


    Mehr unter: https://linuxforums.org.uk/index.php?topic=11864.0
    Bei weiteren Problemen oder Schwierigkeiten empfehle ich die beiden folgenden Github-Seiten, auf denen so ziemlich alle Fehler behoben wurden: https://github.com/StevenHickson/PiAUISuite/issues/56 , https://github.com/StevenHickson/PiAUISuite/issues/55 (Für den No Translation-Fehler)

    KrawallKurt : Bevor man solche unvorsichtige Vorurteile äußert, sollte man sich in das Thema mehr reinschaffen, bevor man es mit "Schrott" abstempeln kann.

    Schönen Nachmittag! :)


  • Vielen dank werde ich noch mal probieren.

    Bezüglich Google API:
    Weiß einer wie die Url lauten müsste, um den Text an Google zu senden und er mir das Audiofile zusendet?

    Das mit der Google API ist so... Wie in den beiden Links zu den Github-Seiten zu lesen, hat Google die Text-To-Speech-API für automatisierte Skripte eingestellt. Das ist wirklich Schade, aber es gibt alternative "Sprachgeneratoren", die man sich schnell installieren kann. Dieses "Austauschen" der Google-TTS und zu einer Alternative ist leider unumgänglich und wird hier beschrieben: https://github.com/StevenHickson/…mment-205171171 (Es wird für das Ersatz-tts-skript das Programm pico2wave benötigt, was man mit

    Code
    sudo apt-get install libttspico-utils

    schnell und einfach installieren kann. )
    Mehr Infos zum Programm: https://wiki.ubuntuusers.de/Sprachausgabe/#SVOX-pico2wave
    Ich persönlich finde es eine gute Alternative zur Google-TTS-Methode, die ohne Probleme sofort funktioniert.

    Ich hoffe, ich konnte helfen. Bei Fragen einfach melden... ;)

    Einmal editiert, zuletzt von flo003 (13. März 2017 um 16:46)

  • Danke das mit der Stimme klappt bestens :)
    Ich bin gerade dabei das oben genannte Script zu überarbeiten, doch leider versteht mich Google nicht ganz und die message.txt bleibt leer :(

    Ausgabe:


    Dazu wäre noch gesagt, dass mein Mikrofon relativ leise ist (obwohl auf 100% bei alsamixer).
    Liegt das wirklich nur an der Lautstärke oder ist das Script falsch?

  • Ehrlich gesagt, das Script, was du verwendest, habe ich selbst nicht getestet...aber wenn du die PiAUISuite installiert hast, solltest du folgenden Befehl in der Kommandozeile ausführen können:

    Code
    speech-recog.sh


    Dieses Programm sendet das aufgezeichnete deiner Stimme an Google und sollte als Antwort deine gesprochenen Wörter (in den 3 Aufnahmesekunden) als Text am Ende des Programms ausgeben. Einfach nach dem Programmaufruf innerhalb von 2-3 Sekunden "Test" in das Mikrofon sagen, und dann sollte das Programm "test" zurückgeben. Wenn das erstmal funktioniert, dann klappt die Auswertung der Sprache schon mal und man kann sich dann an die Sprachsteuerung machen.

    Bei mir klappt das, du kannst es ja mal bei dir testen und dann die Ausgaben des oben genannten Programmaufrufs hier posten.

    Einmal editiert, zuletzt von flo003 (14. März 2017 um 18:11)

Jetzt mitmachen!

Du hast noch kein Benutzerkonto auf unserer Seite? Registriere dich kostenlos und nimm an unserer Community teil!