NEWS
Wie kann ich mehrere Webseiten über eine Schleife parsen?
-
vielleicht hilft dir dieses script beim aufbau - hier kann man sehen, wie das angewendet wird - es werden daten geholt und erst danach werden die daten in einem anderen aufruf verarbeitet und wieder daten geholt - auch das anlegen von datenpunkten sieht man dort gut
https://forum.iobroker.net/topic/38168/script-radar-kontrolle-und-koordinaten-übersetzer
-
@Oli
Warum die Webseite scrapen, wenn du die Daten direkt in JSON abrufen und auswerten kannst.
Die Seite https://tvfueralle.de/ ruft im Hintergrund die Daten per JSON ab.
Hier ein Beispiel für heute:
https://tvfueralle.de/api/broadcasts/2020-12-21Darüber hinaus stehen noch weitere Metadaten zur Verfügung
https://tvfueralle.de/api/channels
https://tvfueralle.de/api/categories
https://tvfueralle.de/api/genres
Ich denke der Link ist beschreibend für den Inhalt
Meines Wissens nach gibt es hier keine Beschränkung wie api token oder Authentifizierung zum Abruf der Daten. -
wo kommt den das her - ich dachte, die dürfen kein tv programm öffentlich machen ?
weißt du, ob man das auch per uhrzeit abfragen kann?
-
@OliverIO mit uhrzeit geht auch
https://tvfueralle.de/api/broadcasts/1012 -
@liv-in-sky
hm, wo kommt das her? aus dem internet?
Wenn du auf der Hauptseite ganz nach unten scrollst, steht etwas über das Projekt.
Hier geht es hauptsächlich darum eine möglichst barrierefreie Programminformation anzubieten mit Ausrichtung
auf Untertitel für Hörgeschädigte und Begleitsprech für Sehbehinderte.
Also ix illegales und ansonsten steht da auch alles mit dabei.
Die JSONs lassen sich auch für die nächsten paar Tage abrufen. Das Namensschema müsste bekannt sein (2012-12-21)
Ich hatte die Seite vor einiger Zeit gefunden und mir Gedanken gemacht. aber es gibt hier ja schon einige TV-Adapter und Skripte -
@liv-in-sky sagte in Wie kann ich mehrere Webseiten über eine Schleife parsen?:
@OliverIO mit uhrzeit geht auch
https://tvfueralle.de/api/broadcasts/1012@liv-in-sky
Nein, das ist einfach der ganze Tag und nicht nur die Uhrzeit. Die API ist Fehlertollerant wie es scheint -
@OliverIO wollt ich fragen - ich hab ja das hoerzu script, welches html parsed und ich nur darauf warte, dass sich die webseite ändert - hast du keine lust einen adapter zu machen ? es gibt keinen guten tv adapter mit vilen sendern, daher habe ich das script gemacht
https://forum.iobroker.net/topic/28447/tv-programm-mini-anzeige-html-tabelle
nicht das ich das script angleiche und dann kommt ein adapter
-
@liv-in-sky
Lust hätte ich schon. Allerdings erst nach Sylvester wieder Zeit.
Als ich mir Gedanken gemacht habe, hatte ich auch schon an verschiedene Widgets gedacht.- Als reine Liste,
- Zum Scrollen hoch/runter links/rechts so wie bei der tv spielfilm app im ipad
- mit Auswahl von Senderfamilien oder Lieblingssender
- Mit Hervorhebung für Lielingssendungen
- Mit eigener Liste nur für Lieblingssender
hups, ich stell ja schon Anforderungsliste zusammen
Mal nach Sylvester schauen. Die Gefahr ist halt, das morgen die API gesperrt ist, wegen zu viel Zugriff.
Ich melde mich. Will dir da aber auch nix wegnehmen. -
wegnehmen gibt's da nicht - ich weiß jetzt, da gibt es jmd. der sich mal gedanken macht - adapter wäre immer besser wie script - ich mache keine adapter und nach sylvester ist doch völlig ok
ich werd mal überlegen, wie ich die daten aus dem json bekomme, um meine tabellen weiterhin zu nutzen - die letzte war eine anzeige von 3 hintereinander folgenden sendungen (pro sender) ab einer frei definierbaren zeit - die nutze ich eigentlich sehr gerne - mal sehen ob ich das json so zerlegen kann
wenn du einen tester brauchst, gib einfach bescheid - bin mir sicher da werden einige mitmachen
ps: vielleicht könntest du jeweils einen datenpunkt für einen sender mit den wichtigen daten (uhrzeit, sendung, bild oder url zu bild) einplanen - der müßte dann auch nur einmal geholt werden und kann dann gut weiterverarbeitet werden ... oje jetzt habe ich deine anforderungsliste auch noch aufgefüllt
-
@liv-in-sky
ich bin mir sicher das es da ganz viele Interessenten und Tester gibt. lese das ja im Forum mit.
Ok challenge angenommen.
Wobei das jetzt auch nicht aufwändiger wie openliga ist.
Das Design der widgets könnte noch eine kleine Herausforderung sein.
JSON als Datenpunkt hinterlegen muss ich mit einplanen, so das da nicht allzuviele Datenzugriffe auf die Seite erfolgen.
Allerdings werden die Bilder da immer direkt geladen. da hoffe ich auf das Caching des Browsers oder der jeweiligen App. -
@OliverIO könnte man die bilder nicht im base64 format speichern un damit auch nur einmal holen
lieber mehr datenplatz als zuviele verbindungen
-
@OliverIO vielleicht braucht es kein eigenes widget - mittlerweile gibt es bessere json widgets wie früher, somit müßte der adapter nur für die zusammenstellung der json sorgen ?
-
@liv-in-sky
ja könnte man machen, dann würde ich aber eine proxy noch dazu programmieren.
hab gerade gesehen, die cache-controls sind gesetzt und liegen bei 30 Tagen oder gar 90 Tagen.
Dürfte reichen. -
-
@liv-in-sky , @OliverIO ,
wenn solche Ideen dabei herauskommen, könnt ihr den thread so oft missbrauchen wie ihr wollt
Ich teste bei den Adapter auch sehr gerne mit, momentan verwende ich ja ebenfalls das Hoerzu-Script.
Extra Widgets finde ich auch, dass es die nicht unbedingt braucht.
-
@Oli
Ich lege die Anzeigelogik immer in Widgets. Der Adapter macht da eigentlich nicht viel, außer regelmäßig die Daten abrufen. -
@liv-in-sky sagte in Wie kann ich mehrere Webseiten über eine Schleife parsen?:
ich werd mal überlegen, wie ich die daten aus dem json bekomme, um meine tabellen weiterhin zu nutzen - die letzte war eine anzeige von 3 hintereinander folgenden sendungen (pro sender) ab einer frei definierbaren zeit - die nutze ich eigentlich sehr gerne - mal sehen ob ich das json so zerlegen kann
wenn ich da etwas behilflich sein darf ich schwöre voll auf jsonata, hier ein kleines Beispiel:
die Daten werden alle geholt und in einen State geschrieben. Jetzt kann man mit der jsonata Expression spielen, ohne jedesmal die Daten zu ziehen, das Ergebnis wird wieder in einen State geschrieben. Die beiden States manuell anlegen, war ich jetzt zu faul dazu.../** * Zweck: Holt TV-Programminformationen * Datum: 21.12.2020 * Author: @fastfoot * Forum: https://forum.iobroker.net/topic/39896/wie-kann-ich-mehrere-webseiten-%C3%BCber-eine-schleife-parsen/11 * */ let axios = require('axios').default; let jsonata = require('jsonata'); let url= 'https://tvfueralle.de/api/broadcasts/1012'; let idBase = '0_userdata.0.TV'; let sender = '.' // beliebig let expr = ` $.events[eventId.$match(/^${sender}/) and startTime >= "2020-12-21T20:00" and startTime <= "2020-12-21T20:15"]^(startTime).{ "title": title, "eventId": eventId, "startTime": startTime, "endTime": endTime, "duration": duration / 60 }` async function getData(url) { const res = await axios.get(url); if(res.status == 200) { await setStateAsync(`${idBase}.TVProgramm`,JSON.stringify(res.data)) } } async function main(refresh = false) { if(refresh){ await getData(url); } let test = JSON.parse((await getStateAsync(`${idBase}.TVProgramm`)).val); let json = jsonata(expr).evaluate(test); setState(`${idBase}.json`,JSON.stringify(json)); log(JSON.stringify(json)) } main(!true);
Die erzeugten Daten in einem json-Widget
-
natürlich darfst du helfen - freu mich sogar - jsonata hatte ich schon mal gehört - werd ich mal ansehen, vielleicht kann ich es gut gebrauchen für meine "überlegungen" - weihnachten haben wir ja viel zeit
falls du eine gute beschreibung hast oder ein gutes video kennst - wenn nicht, find ich schon was
-
@fastfoot
und wer gern mit json spielt, kann hier mein noch flexibleres json widget mal betrachten.
Darüber kann man beliebige json-Daten über eine Templatesprache in eine beliebige Ansicht bringen.
für diejenigen, denen json table zu unflexibel ist.https://forum.iobroker.net/topic/31521/test-widget-json-template
-
@liv-in-sky sagte in Wie kann ich mehrere Webseiten über eine Schleife parsen?:
natürlich darfst du helfen - freu mich sogar - jsonata hatte ich schon mal gehört - werd ich mal ansehen, vielleicht kann ich es gut gebrauchen für meine "überlegungen" - weihnachten haben wir ja viel zeit
falls du eine gute beschreibung hast oder ein gutes video kennst - wenn nicht, find ich schon was
Hier ein Link zur Doku, wollte dir ein Beispiel auf try.jsonata.org erstellen, aber bekomme keinen Link zum sharen erstellt, wahrscheinlich zuviele Daten im Beispiel. Das json links rein pasten, rechts der Ausdruck aus dem Skript, ${sender} ersetzen durch zB ard
Hat jetzt doch geklappt, hab einiges an Daten gelöscht: https://try.jsonata.org/hz-my_j6Z
Ansonsten fragen, bin aber blutiger Anfänger