NEWS
Parser Aktienkurse
-
Hallo,
habe immer noch mein Problem mit Parser und den Aktienkursen.
Habe hier unter regex101 schon alles mögliche probiert, bekomme aber keinen Wert.
https://regex101.com/r/zn69E7/1 -
@gregors Probiers mal so:
.*class="snapshot__value-current realtime-push"><span>(\d*,\d*).*
da eh nur ein Kurs drin ist, kannst Dir das alles auch sparen
(\d+,\d+)
oder falls Du keine Gruppen brauchst - halt die Klammern weglassen.
Du siehst doch in dem Editor hervorragend, ob es matched oder nicht?
-
@mickym
Da gibt es 2 Werte, den Aktienkurs und die Änderung.
Wollte es erstmal mit dem 1. probieren.Das hat auf jeden Fall funktioniert.
Nun muss ich mich mal an die Änderung geben.
Danke -
@gregors Du siehst doch in dem Editor sofort, ob es matched oder nicht.
Du fängst halt mit .* an - dann wird eh alles markiert und näherst Dich immer mehr an.
-
@mickym
Irgendwas mach ich da wohl falsch.
Bei mir kommt immer "no match".Habe mir gerade den Regex für die Änderung gestrickt,
.class="snapshot__value-absolute realtime-push realtime-push--state-positive"><span>([-|+]\d,\d*).* -
@gregors Das entspricht ja auch nicht dem, was ich unten gepostet habe.
.*class="snapshot__value-absolute realtime-push realtime-push--state-positive"><span>(\d+,\d+).*
Probierst halt mal so - oder wie gesagt immer mit dem Editor - obs matched.
Fange immer mit
.*
an im Editor und dann merkst Du selbst, ab wann das matchen aufhört.
-
Werde es nochmal versuchen.
Werte sind schonmal da. -
Habe meine Werte,
aber irgendwann kommen immer wieder diese Fehler im Log.parser.0 2022-09-13 09:28:47.842 error Cannot read link "https://www.finanzen.net/aktien/flughafen_zuerich-aktie": Error: ESOCKETTIMEDOUT parser.0 2022-09-13 09:28:47.820 error Cannot read link "https://www.finanzen.net/aktien/flughafen_zuerich-aktie": Error: ESOCKETTIMEDOUT parser.0 2022-09-13 09:26:11.753 error Cannot read link "https://www.finanzen.net/aktien/drillisch-aktie@stBoerse_TGT": Error: ESOCKETTIMEDOUT parser.0 2022-09-13 09:26:11.753 error Cannot read link "https://www.finanzen.net/aktien/aurelius-aktie@stBoerse_TGT": Error: ESOCKETTIMEDOUT parser.0 2022-09-13 09:26:11.750 error Cannot read link "https://www.finanzen.net/aktien/drillisch-aktie@stBoerse_TGT": Error: ESOCKETTIMEDOUT parser.0 2022-09-13 09:26:11.750 error Cannot read link "https://www.finanzen.net/aktien/aurelius-aktie@stBoerse_TGT": Error: ESOCKETTIMEDOUT parser.0 2022-09-13 09:20:59.553 error Cannot read link "https://www.finanzen.net/aktien/aurelius-aktie@stBoerse_TGT": Error: ESOCKETTIMEDOUT parser.0 2022-09-13 09:20:59.552 error Cannot read link "https://www.finanzen.net/aktien/drillisch-aktie@stBoerse_TGT": Error: ESOCKETTIMEDOUT parser.0 2022-09-13 09:20:59.547 error Cannot read link "https://www.finanzen.net/aktien/aurelius-aktie@stBoerse_TGT": Error: ESOCKETTIMEDOUT parser.0 2022-09-13 09:20:59.546 error Cannot read link "https://www.finanzen.net/aktien/drillisch-aktie@stBoerse_TGT": Error: ESOCKETTIMEDOUT parser.0 2022-09-13 09:18:23.650 error Cannot read link "https://www.finanzen.net/aktien/flughafen_zuerich-aktie": Error: read ECONNRESET parser.0 2022-09-13 09:18:23.647 error Cannot read link "https://www.finanzen.net/aktien/flughafen_zuerich-aktie": Error: read ECONNRESET parser.0 2022-09-13 09:10:34.678 error Cannot read link "https://www.finanzen.net/aktien/drillisch-aktie@stBoerse_TGT": Error: ESOCKETTIMEDOUT parser.0 2022-09-13 09:10:34.665 error Cannot read link "https://www.finanzen.net/aktien/drillisch-aktie@stBoerse_TGT": Error: ESOCKETTIMEDOUT
Die Web-Site von finanzen.net ist erreichbar.
-
@gregors
Das ist halt das gefährliche an solchen Abfragen.
Du feuerst innerhalb 3! Millisekunden 4 Abfragen auf den gleichen Server Und das sind nur die, die Fehler erzeugt haben, wer weiß wieviel Abfragen da noch gleichzeitig laufen und durchgegangen sind.Wahrscheinlich hat finanzen.net da eine Erkennung drin, die solche Abfragen unterbindet.
Ausschnitt aus den Nutzungsbedingungen von finanzen.net Kapitel 6
https://www.finanzen.net/nutzungsbedingungen(3) Insbesondere ist eine automatisierte Abfrage der von finanzen.net bereitgestellten Inhalte ohne ausdrückliche Genehmigung in jeglicher Form nicht zulässig.
Wenn das zu viele machen und überreizen, dann wird sich der Betreiber uU Mechanismen überlegen, wie man das unterbinden kann.
Wenn du da jede Sekunde eine Abfrage absendest, dann kann der Anbieter das sicherlich nicht unterscheiden ob das von einem Skript oder von einem Browser kommt.
Ich würde allerdings IP-basierte Statistiken laufen lassen und schauen, welche IP, wie oft pro Tag da abrufen und nach einer gewissen Zeit diese IPs sperren.
Von daher, kann ich keinen Fehler erkennen.