Dateien mit Umlauten von Windows an Raspi übertragen

  • Hallo zusammen,

    die Google Suche hat mich leider nicht weitergebracht, aber vielleicht könnt ihr mir helfen. Ich möchte Textdateien von Windows auf Raspbian übertragen, wobei der Raspberry Pi "headless" läuft über eine Windows Remote Desktopverbindung. Bisher habe ich mir bei allen Versuchen die Umlaute zerstört und musste die Datei auf dem Pi erst wieder reparieren. Copy (Windows) & Paste (Raspian) funktioniert genauso wenig wie die Windows Datei in einen Shared Pi-Ordner zu legen. Locale habe ich ausgelesen und das zeigt mir UTF-8 an und die Dateien auf Windows speichere ich auch in diesem Format.

    Habt ihr einen Tipp, wie ich das Problem abstellen oder zumindest umgehen kann?

    Danke!

  • Dateien mit Umlauten von Windows an Raspi übertragen? Schau mal ob du hier fündig wirst!

  • Wenn Quelle und Ziel sicher UTF8 benutzen, kann ja nur die Übertragung dazwischen (rdp) schuld sein.

    Welches Encoding haben die erzeugten Dateien denn (file -bi <dateiname> )?

    Wenn du nichts zu sagen hast, sag einfach nichts.

  • An und für sich werden die Dateinamen an der SAMBA Schnittstelle von Windows nach Linux (und umgekehrt) konvertiert.

    Der Zeichensatz des Dateiinhaltes bleibt aber grundsätzlich unverändert.

    Wird ein Dokument im Windows - Zeichensatz (ISO 8859-1) erstellt und im Linux Zeichensatz (UTF-8) gelesen, werden nur die Zeichen richtig dargestellt, die bei beiden Zeichensätzen ident sind. Das ist eigentlich nur bei den ersten 7 Bit der druckbaren Zeichen der Fall, wenn man Windows ISO 8859-1 (Latin-1) mit Linux Unicode (UTF-8 = ISO 10646) vergleicht.

    < man ascii >

    < man iso_8859-1 > < man cp1252 >

    < man unicode > < man utf-8 >

    Eine mit Windows ISO 8859-1 erstellte Datei, egal wo sie abgespeichert wird, muss daher - wenn sie Sonderzeichen enthält - vorher mit dem Linuxprogramm "iconv" im Zeichensatz konvertiert werden, damit sie auf einem Linux Host, der auf UTF-8 konfiguriert ist, richtig dargestellt wird.

    Natürlich ist es möglich, den Linux Host auf einen anderen Zeichensatz zu konfigurieren. Bei der Erstinbetriebnahme wurde von raspi-config aber UTF-8 angeboten und (wahrscheinlich) bestätigt. Damit wurde der Pi Mitglied der weltweiten Unicode - Familie und braucht nicht für jedes Land auf der Erde einen eigenen Zeichensatz.

    Bei der nachträglichen Umstellung kommt es aber wahrscheinlich zu unerwarteten Sideeffects, weshalb UTF-8 am Pi belassen werden sollte, auch bei der Erstinbetriebnahme.

    Servus !

    RTFM = Read The Factory Manual, oder so

  • So, hier das Feedback. Ich habe jetzt folgenden Test durchgeführt:

    • Unter Windows (Notepad++) eine Datei im UTF-8 Format auf die Windows Festplatte geschrieben. In der rechten unteren Ecke im Notepad++ wird UTF-8 angezeigt.
    • Die Datei unter Windows auf das Shared Samba Verzeichnis des Pi kopiert
    • file -bi utfTest.txt wirft dann "text/plain; charset=unknown-8bit" raus
    • locale wirft für alle angezeigten Parameter "...DE.UTF-8" raus
    • Wenn ich die Datei auf dem Pi mit Windows Notepad++ öffne wird wieder UTF-8 angezeigt und die Umlaute sind korrekt
    • Wenn ich die gleiche Datei mit dem Standard Text-Editor auf dem Pi öffne sind die Umlaute verkorkst

    Ideen?

    • file -bi utfTest.txt wirft dann "text/plain; charset=unknown-8bit" raus

    Solange der Filetest nicht charset=UTF-8 anzeigt, wird der Fileinhalt am Linux Host auch nicht als UTF-8 ausgegeben (sondern nur die ersten 127 Zeichen von UTF-8 verwendet.)

    Das könnte durch den Mime-Type "txt" veranlasst werden (in /etc/mime.types), da imho text/plain nur druckbare Zeichen bis dez 127 (7-Bit) erwartet.

    Lass einmal ".txt" im Linux Filenamen weg, möglicherweise wird dann schon im Filetest charset=UTF-8 und das File wird erwartungsgemäss angezeigt.

    Servus !

    RTFM = Read The Factory Manual, oder so

  • Vielen Dank für eure Hilfe. Erstaunlicher Weise klappt es jetzt und alle neuen von Windows zum Pi kopierten Dateien haben das Charset UTF-8, obwohl ich bisher keinerlei Einstellungen geändert habe. Die alte Datei zeigt das Problem immer noch und alle meine Versuche sind bisher gescheitert diese Datei sauber von Windows zum Pi zu kopieren. Aber das soll mir jetzt auch egal sein, die Datei wird gelöscht. Auch wenn das für mich ein großes Rätsel ist soll es mir recht sein. Ich werde zukünftig auf euren Tipp achten und das Charset der Datei mit "file -bi" im Auge behalten.

    Danke!

Jetzt mitmachen!

Du hast noch kein Benutzerkonto auf unserer Seite? Registriere dich kostenlos und nimm an unserer Community teil!