NEWS
Daten aus Webseite ziehen
-
@joergh sagte in Daten aus Webseite ziehen:
oder @Homoran mir direkt helfen würde.
ich kann dir beim Regex helfen, aber nicht via Blockly.
brauche dann den vollständig Quelltext und was du daraus haben willst
-
@homoran Der Quelltext steckt oben hinter dem Spoiler.
-
@joergh sagte in Daten aus Webseite ziehen:
die erste, kommende Zeitspanne Tag
yMonth">[^\w]+(.+)
da gibt es 29 Treffer@joergh sagte in Daten aus Webseite ziehen:
Uhrzeit
"Time":"([\d,-: ]+)
-
@homoran Danke. Ja, ich brauche nur das erste, also naheliegenste Datum und die dazu passende Startzeit.
Wie kriege ich das nun ausgelesen?
Wen ich den Parseradapter nehme, dann muss ich da ja fix die Webseite in den Einstellungen eintragen, aber bei meiner Webseite kann sich die Adresse ändern...? -
@joergh sagte in Daten aus Webseite ziehen:
. Ja, ich brauche nur das erste, also naheliegenste Datum und die dazu passende Startzeit.
beim Parser stellst du dazu NUM auf 1
wie es mit Blockly geht, weiß ich nicht.
@liv-in-sky hat sowas in javascript gemacht.zum üben für Regexes ist regex101.com optimal, selbst am Tablet
-
@homoran @OliverIO Ok, jetzt habe ich die Daten ziehen können und bekomme auch ein Ergebnis angezeigt, wenn ich das Ganze in den Einstellungen teste.
Er legt die DP an, aber diese bleiben leider leer, obwohl er zuvor in den Einstellungen den String als Ergebnis angezeigt hat...?Woran liegt das nun wieder?
Die Einstellungen sehen so aus:
-
@joergh das angezeigte Ergebnis ist aber sehr lang.
Glaube nicht das du das so speichern möchtest.Ist die Seite im allgemeinen Zugriff ohne Passwort?
Dann könntest du uns die Daten mal Copy/Paste fähig bereit stellengenaue HTTP-Adresse
und welche Daten du da extrahieren willst.So ohne weiteres ist die analyse mit deinen Angaben nicht möglich
-
@oliverio sagte in Daten aus Webseite ziehen:
@joergh das angezeigte Ergebnis ist aber sehr lang.
Glaube nicht das du das so speichern möchtest.Eigentlich würde mir das Tagesdatum reichen (und die erste Uhrzeit), aber das hätte ich mir dann eben aus dem String rausgeschnitten...Ich habe den Suchparameter von @Homoran übernommen. Kann ich das kürzen?
Ist die Seite im allgemeinen Zugriff ohne Passwort?
Ja, ist sie. Es ist die Seite des staatlichen Stromanbieters, der so bekannt gibt wann er in bestimmten Gebieten den Saft abgdreht. Dazu gibt es je nach Stufe die er in den Regionen unterschiedlich festlegt eine andere Tabelle die zur Anwendung kommt. Die Adresse setzt sich also aus einem festen Teil und einer Variable (Stage) und dann wieder zwei festen Elementen zusammen für die Region zusammen.
Dann könntest du uns die Daten mal Copy/Paste fähig bereit stellen
genaue HTTP-Adresse
und welche Daten du da extrahieren willst.https://loadshedding.eskom.co.za/LoadShedding/GetScheduleM/1060136/2/9/1
Die Seite wird nur befüllt, wenn tatsächlich Loadshedding aktiv ist, ansonsten sind die nicht verfügbar. Bis morgen ist das derzeit der Fall.
So ohne weiteres ist die analyse mit deinen Angaben nicht möglich
Was fehlt denn? Im Spoiler hatte ich den kompletten Code der Seite derzeit abgebildet und die anderen Einstellungen im Parser habe ich zuletzt gepostet. Irgendwie übernimmt er aber das Ergebnis nicht in die Datenpunkte.
-
@oliverio sagte in Daten aus Webseite ziehen:
das angezeigte Ergebnis ist aber sehr lang.
ich weiß auch warum
hab hier am Tablet keinen Parser Adapter.muss mir am PC mal ansehen wie der Regex bei ioBroker umgesetzt wird
-
wäre das hier, das richtige ergebnis für das obere beispiel?
habe das in dein blockly zum testen hinzugefügt
hier dein blockly mit den test funktionen - bin nicht sicher, ob das result aus dem request genauso zurückkommt - einfach mal testen - dann sehen wir's
-
@joergh Versuch mal
yMonth">[^\S]+(\S+ \d+ \S+)
was ist mit dem Datum?
-
@liv-in-sky Danke!
Ich habe nun folgendes aus Deinen JS Skripten gebastelt:
var x, Schedule, result, Ergebnis, Tag, Uhrzeit; // Beschreibe diese Funktion … async function Tag2(x) { let z=x.replace(/\n/,"") y=z.match(/yMonth"> (.*?)<\/div>/gm) return y[0].replace('yMonth">',"").replace('<\/div>',""); } // Beschreibe diese Funktion … async function Uhrzeit2(x) { let y=x.match(/"Time":"([\d,-: ]+)/gm) return y[0].replace('"Time":"',""); } schedule("*/20 * * * * *", async function () { try { require("request")('https://loadshedding.eskom.co.za/LoadShedding/GetStatus', async function (error, response, result) { Schedule = parseFloat(parseFloat(result)) - 1; if (Schedule > 0) { console.log((['Loadshedding Stage ',Schedule,' !'].join(''))); try { require("request")(([' https://loadshedding.eskom.co.za/LoadShedding/GetScheduleM/1060136/',Schedule,'/9/1'].join('')), async function (error, response, result) { Ergebnis = result; Tag = await Tag2(Ergebnis); Uhrzeit = await Uhrzeit2(Ergebnis); console.log((String(Tag) + String(Uhrzeit))); }).on("error", function (e) {console.error(e);}); } catch (e) { console.error(e); } } }).on("error", function (e) {console.error(e);}); } catch (e) { console.error(e); } }); 
Da erscheinen folgende Fehlermeldungen:
8.3.2022, 11:38:51.622 [error]: javascript.0 (1484) script.js.Eskom_Loadshedding: {'errno':-104,'code':'ECONNRESET','syscall':'read'} 8.3.2022, 11:38:51.625 [error]: javascript.0 (1484) script.js.Eskom_Loadshedding: TypeError: Cannot read property 'replace' of undefined 8.3.2022, 11:38:51.625 [error]: javascript.0 (1484) at Tag2 (script.js.Eskom_Loadshedding:5:13) 8.3.2022, 11:38:51.625 [error]: javascript.0 (1484) at script.js.Eskom_Loadshedding:34:21 8.3.2022, 11:39:01.979 [info ]: javascript.0 (1484) script.js.Eskom_Loadshedding: Loadshedding Stage 2 ! 8.3.2022, 11:39:17.857 [error]: javascript.0 (1484) script.js.Eskom_Loadshedding: TypeError: Cannot read property '0' of null 8.3.2022, 11:39:17.859 [error]: javascript.0 (1484) at Tag2 (script.js.Eskom_Loadshedding:11:13) 8.3.2022, 11:39:17.859 [error]: javascript.0 (1484) at script.js.Eskom_Loadshedding:33:21 8.3.2022, 11:39:21.412 [info ]: javascript.0 (1484) script.js.Eskom_Loadshedding: Loadshedding Stage 2 ! 8.3.2022, 11:39:24.164 [error]: javascript.0 (1484) script.js.Eskom_Loadshedding: TypeError: Cannot read property '0' of null 8.3.2022, 11:39:24.165 [error]: javascript.0 (1484) at Tag2 (script.js.Eskom_Loadshedding:11:13) 8.3.2022, 11:39:24.166 [error]: javascript.0 (1484) at script.js.Eskom_Loadshedding:33:21 8.3.2022, 11:39:40.215 [info ]: javascript.0 (1484) script.js.Eskom_Loadshedding: Loadshedding Stage 2 ! 8.3.2022, 11:39:45.390 [error]: javascript.0 (1484) script.js.Eskom_Loadshedding: {'errno':-104,'code':'ECONNRESET','syscall':'read'} 8.3.2022, 11:39:45.394 [error]: javascript.0 (1484) script.js.Eskom_Loadshedding: TypeError: Cannot read property 'replace' of undefined 8.3.2022, 11:39:45.394 [error]: javascript.0 (1484) at Tag2 (script.js.Eskom_Loadshedding:5:13) 8.3.2022, 11:39:45.396 [error]: javascript.0 (1484) at script.js.Eskom_Loadshedding:33:21 8.3.2022, 11:40:00.237 [info ]: javascript.0 (1484) script.js.Eskom_Loadshedding: Loadshedding Stage 2 ! 8.3.2022, 11:40:02.405 [error]: javascript.0 (1484) script.js.Eskom_Loadshedding: TypeError: Cannot read property '0' of null 8.3.2022, 11:40:02.406 [error]: javascript.0 (1484) at Tag2 (script.js.Eskom_Loadshedding:11:13) 8.3.2022, 11:40:02.406 [error]: javascript.0 (1484) at script.js.Eskom_Loadshedding:33:21 8.3.2022, 11:40:20.176 [info ]: javascript.0 (1484) script.js.Eskom_Loadshedding: Loadshedding Stage 2 ! 8.3.2022, 11:40:20.423 [error]: javascript.0 (1484) script.js.Eskom_Loadshedding: TypeError: Cannot read property '0' of null 8.3.2022, 11:40:20.425 [error]: javascript.0 (1484) at Tag2 (script.js.Eskom_Loadshedding:11:13) 8.3.2022, 11:40:20.425 [error]: javascript.0 (1484) at script.js.Eskom_Loadshedding:33:21 8.3.2022, 11:40:41.834 [info ]: javascript.0 (1484) script.js.Eskom_Loadshedding: Loadshedding Stage 2 ! 8.3.2022, 11:40:42.116 [error]: javascript.0 (1484) script.js.Eskom_Loadshedding: TypeError: Cannot read property '0' of null 8.3.2022, 11:40:42.117 [error]: javascript.0 (1484) at Tag2 (script.js.Eskom_Loadshedding:11:13) 8.3.2022, 11:40:42.118 [error]: javascript.0 (1484) at script.js.Eskom_Loadshedding:33:21
-
@joergh zeile 20 replace ist falsch
return y[0].replace('"Time":"',"");
sollte:
return y[0].replace('"Time"':',');
-
@homoran sagte in Daten aus Webseite ziehen:
@joergh Versuch mal
yMonth">[^\S]+(\S+ \d+ \S+)
was ist mit dem Datum?
Danke. Damit bekomme ich den Tag schon einmal perfekt ausgeschnitten. Fehlt nur noch das Datum und das entsprechende korrekte JS Skript, dann dürfte ich mit Blockly-Mitteln weiter schnipplen können.
-
warum fügst du eigentlich das blockly nicht einfach zusammen - dein ergebnis (result) bei meinen blocks nutzen und in den request mit reinschreiben ?
-
@liv-in-sky Das habe ich doch gemacht. Ich habe Deinen Code importiert und dann die Teile in mein Blockly eingebaut mit Copy/Paste oder was meinst Du?
-
@joergh sorry - da habe ich was falsch verstanden - diese werte gehören ja oben in den request -oder
-
@liv-in-sky sagte in Daten aus Webseite ziehen:
return y[0].replace('"Time":"',"");
Bist Du sicher? Das wirft bei mir einen Compile Error aus. Außerdem zeigt er den Fehler doch in Zeile 11 an und das wäre bei mir das andere JS Skript, welches den Tag ermitteln soll. Da scheint ein Fehler in der return... Zeile zu stecken...
-
@joergh said in Daten aus Webseite ziehen:
@homoran @OliverIO Ok, jetzt habe ich die Daten ziehen können und bekomme auch ein Ergebnis angezeigt, wenn ich das Ganze in den Einstellungen teste.
Er legt die DP an, aber diese bleiben leider leer, obwohl er zuvor in den Einstellungen den String als Ergebnis angezeigt hat...?Woran liegt das nun wieder?
Die Einstellungen sehen so aus:
In Regex gibt es Optionen, die man leider so direkt im iobroker nicht angeben kann.
Im Parser-Adapter gibt es eine Logik, die diese ermittelt und leider je nach Suche ist die immer etwas anders.wenn man in Regex die Optionen auf /gs einstellt, dann stimmt die dortige Suche mit dem Ergebnis im Parseradapter überein. Leider gibt es mit dem Pattern von Homoran alles ab Fundstelle bis zum Ende zurück. Das kann sein, das das der Parseradapter nicht macht und deswegen dein Alternativwert (null) ausgibt.
Probiere es einmal mit diesem
yMonth">\s+([\w, ]+)
Das Pattern mit Time müsste so passen.
-
@oliverio sagte in Daten aus Webseite ziehen:
Leider gibt es mit dem Pattern von Homoran alles ab Fundstelle bis zum Ende zurück.
gab!
habe es inzwischen angepasst und es läuft erfolgreich:@joergh sagte in Daten aus Webseite ziehen:
@homoran sagte in Daten aus Webseite ziehen:
@joergh Versuch mal yMonth">[^\S]+(\S+ \d+ \S+)
was ist mit dem Datum?Danke. Damit bekomme ich den Tag schon einmal perfekt ausgeschnitten