NEWS
Parse Adapter - Ergebnis zeigt falsche Umlaute an
-
Hallo,
ich nutze den Parser-Adapter um mir von der www.texxas.de Seite das momentane TV-Programm in Form einer xlm-Datei herunterzuladen. Das klappt sehr gut bis auf die Tatsache, dass die Umlaute nur als ? dargestellt werden. Das betrifft ä,ö,ü, ß.
Liegt das an der Webseite oder muss ich irgend etwas noch in den Parser-Settings beachten??? Bin echt am verzweifeln.http request -
@kottdie
Die Seite liefert wohl
content="text/html; charset=utf-8"
ab. Am einfachsten schaust du mal, ob dein System auch auf utf-8 läuft.
Geht unter linux mitlocaleIm Idealfall kommt sowas dabei heraus:
pi@raspberrypi:~ $ locale LANG=de_DE.UTF-8 LANGUAGE= LC_CTYPE="de_DE.UTF-8" LC_NUMERIC="de_DE.UTF-8" LC_TIME="de_DE.UTF-8" LC_COLLATE="de_DE.UTF-8" LC_MONETARY="de_DE.UTF-8" LC_MESSAGES="de_DE.UTF-8" LC_PAPER="de_DE.UTF-8" LC_NAME="de_DE.UTF-8" LC_ADDRESS="de_DE.UTF-8" LC_TELEPHONE="de_DE.UTF-8" LC_MEASUREMENT="de_DE.UTF-8" LC_IDENTIFICATION="de_DE.UTF-8" LC_ALL= -
@kottdie
Die Seite liefert wohl
content="text/html; charset=utf-8"
ab. Am einfachsten schaust du mal, ob dein System auch auf utf-8 läuft.
Geht unter linux mitlocaleIm Idealfall kommt sowas dabei heraus:
pi@raspberrypi:~ $ locale LANG=de_DE.UTF-8 LANGUAGE= LC_CTYPE="de_DE.UTF-8" LC_NUMERIC="de_DE.UTF-8" LC_TIME="de_DE.UTF-8" LC_COLLATE="de_DE.UTF-8" LC_MONETARY="de_DE.UTF-8" LC_MESSAGES="de_DE.UTF-8" LC_PAPER="de_DE.UTF-8" LC_NAME="de_DE.UTF-8" LC_ADDRESS="de_DE.UTF-8" LC_TELEPHONE="de_DE.UTF-8" LC_MEASUREMENT="de_DE.UTF-8" LC_IDENTIFICATION="de_DE.UTF-8" LC_ALL=@Thomas-Braun
bekomme bei "locale" das gleiche was Du im Post aufzeigst. Im header der xml-Datei steht was von
"<?xml version="1.0" encoding="ISO-8859-1"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:sy="http://purl.org/rss/1.0/modules/syndication/" xmlns:dc="http://purl.org/dc/elements/1.1/"><channel><title>teXXas - Hauptsender, was l�uft jetzt?</title><link>https://www.texxas.de/tv/programm/jetzt/hauptsender/</link><description>Fernsehprogramm f�r Hauptsender, was l�uft jetzt?</description><language>de-de</language><pubDate>Sat, 23 May 2020 22:00:01 GMT</pubDate><managingEditor>info@texxas.de (teXXas Support)</managingEditor><ttl>5</ttl>sy:updatePerioddaily</sy:updatePeriod>sy:updateFrequency1</sy:updateFrequency>sy:updateBase2020-05-24T19:04: -
@Thomas-Braun
bekomme bei "locale" das gleiche was Du im Post aufzeigst. Im header der xml-Datei steht was von
"<?xml version="1.0" encoding="ISO-8859-1"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:sy="http://purl.org/rss/1.0/modules/syndication/" xmlns:dc="http://purl.org/dc/elements/1.1/"><channel><title>teXXas - Hauptsender, was l�uft jetzt?</title><link>https://www.texxas.de/tv/programm/jetzt/hauptsender/</link><description>Fernsehprogramm f�r Hauptsender, was l�uft jetzt?</description><language>de-de</language><pubDate>Sat, 23 May 2020 22:00:01 GMT</pubDate><managingEditor>info@texxas.de (teXXas Support)</managingEditor><ttl>5</ttl>sy:updatePerioddaily</sy:updatePeriod>sy:updateFrequency1</sy:updateFrequency>sy:updateBase2020-05-24T19:04:@kottdie sagte in Parse Adapter - Ergebnis zeigt falsche Umlaute an:
ISO-8859-1
Die Daten kommen also in ISO-8859-1 an.
Auf der Konsole kann man das mit iconv umkodieren. Wie man das in JavaSkript tut muss dir jemand anderes verraten. -
@kottdie sagte in Parse Adapter - Ergebnis zeigt falsche Umlaute an:
ISO-8859-1
Die Daten kommen also in ISO-8859-1 an.
Auf der Konsole kann man das mit iconv umkodieren. Wie man das in JavaSkript tut muss dir jemand anderes verraten.@Thomas-Braun sagte in Parse Adapter - Ergebnis zeigt falsche Umlaute an:
Auf der Konsole kann man das mit iconv umkodieren. Wie das in JavaSkript tut muss dir jemand anderes verraten.
...und im parser Adapter wird es wohl so einfach gar nicht gehen.
-
@Thomas-Braun sagte in Parse Adapter - Ergebnis zeigt falsche Umlaute an:
Auf der Konsole kann man das mit iconv umkodieren. Wie das in JavaSkript tut muss dir jemand anderes verraten.
...und im parser Adapter wird es wohl so einfach gar nicht gehen.
@Homoran Gut möglich. Kenn den Adapter nicht. :-)
-
@Homoran Gut möglich. Kenn den Adapter nicht. :-)
@Thomas-Braun Das einzige was dort gehen würde, wenn man mit dem Aufruf des URL die Codierung mitgeben könnte, die die Antwort haben soll
-
@kottdie sagte in Parse Adapter - Ergebnis zeigt falsche Umlaute an:
wie müsste das aussehen ?
Das weiß ich eben nicht.
Nicht einmal ob so etwas überhaupt geht -
@kottdie
Kannst ja auch mal versuchen den Ersteller des RSS-Feeds dazu zu bewegen, dass er da auf UTF-8 umstellt.
Hey! Du scheinst an dieser Unterhaltung interessiert zu sein, hast aber noch kein Konto.
Hast du es satt, bei jedem Besuch durch die gleichen Beiträge zu scrollen? Wenn du dich für ein Konto anmeldest, kommst du immer genau dorthin zurück, wo du zuvor warst, und kannst dich über neue Antworten benachrichtigen lassen (entweder per E-Mail oder Push-Benachrichtigung). Du kannst auch Lesezeichen speichern und Beiträge positiv bewerten, um anderen Community-Mitgliedern deine Wertschätzung zu zeigen.
Mit deinem Input könnte dieser Beitrag noch besser werden 💗
Registrieren Anmelden