NEWS
Parse Adapter - Ergebnis zeigt falsche Umlaute an
-
Hallo,
ich nutze den Parser-Adapter um mir von der www.texxas.de Seite das momentane TV-Programm in Form einer xlm-Datei herunterzuladen. Das klappt sehr gut bis auf die Tatsache, dass die Umlaute nur als ? dargestellt werden. Das betrifft ä,ö,ü, ß.
Liegt das an der Webseite oder muss ich irgend etwas noch in den Parser-Settings beachten??? Bin echt am verzweifeln.http request -
@kottdie Da muss die Zeichenkodierung umformatiert werden.
-
und was ist da genau zu tun ?
-
@kottdie
Die Seite liefert wohl
content="text/html; charset=utf-8"
ab. Am einfachsten schaust du mal, ob dein System auch auf utf-8 läuft.
Geht unter linux mitlocale
Im Idealfall kommt sowas dabei heraus:
pi@raspberrypi:~ $ locale LANG=de_DE.UTF-8 LANGUAGE= LC_CTYPE="de_DE.UTF-8" LC_NUMERIC="de_DE.UTF-8" LC_TIME="de_DE.UTF-8" LC_COLLATE="de_DE.UTF-8" LC_MONETARY="de_DE.UTF-8" LC_MESSAGES="de_DE.UTF-8" LC_PAPER="de_DE.UTF-8" LC_NAME="de_DE.UTF-8" LC_ADDRESS="de_DE.UTF-8" LC_TELEPHONE="de_DE.UTF-8" LC_MEASUREMENT="de_DE.UTF-8" LC_IDENTIFICATION="de_DE.UTF-8" LC_ALL=
-
@Thomas-Braun
bekomme bei "locale" das gleiche was Du im Post aufzeigst. Im header der xml-Datei steht was von
"<?xml version="1.0" encoding="ISO-8859-1"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:sy="http://purl.org/rss/1.0/modules/syndication/" xmlns:dc="http://purl.org/dc/elements/1.1/"><channel><title>teXXas - Hauptsender, was l�uft jetzt?</title><link>https://www.texxas.de/tv/programm/jetzt/hauptsender/</link><description>Fernsehprogramm f�r Hauptsender, was l�uft jetzt?</description><language>de-de</language><pubDate>Sat, 23 May 2020 22:00:01 GMT</pubDate><managingEditor>info@texxas.de (teXXas Support)</managingEditor><ttl>5</ttl>sy:updatePerioddaily</sy:updatePeriod>sy:updateFrequency1</sy:updateFrequency>sy:updateBase2020-05-24T19:04: -
@kottdie sagte in Parse Adapter - Ergebnis zeigt falsche Umlaute an:
ISO-8859-1
Die Daten kommen also in ISO-8859-1 an.
Auf der Konsole kann man das mit iconv umkodieren. Wie man das in JavaSkript tut muss dir jemand anderes verraten. -
@Thomas-Braun sagte in Parse Adapter - Ergebnis zeigt falsche Umlaute an:
Auf der Konsole kann man das mit iconv umkodieren. Wie das in JavaSkript tut muss dir jemand anderes verraten.
...und im parser Adapter wird es wohl so einfach gar nicht gehen.
-
@Homoran Gut möglich. Kenn den Adapter nicht.
-
@Thomas-Braun Das einzige was dort gehen würde, wenn man mit dem Aufruf des URL die Codierung mitgeben könnte, die die Antwort haben soll
-
wie müsste das aussehen ?
-
@kottdie sagte in Parse Adapter - Ergebnis zeigt falsche Umlaute an:
wie müsste das aussehen ?
Das weiß ich eben nicht.
Nicht einmal ob so etwas überhaupt geht -
@kottdie
Kannst ja auch mal versuchen den Ersteller des RSS-Feeds dazu zu bewegen, dass er da auf UTF-8 umstellt.