Corona-Daten nach MySQL importieren

sissiwup

RKI hat neue Werte hinzugefügt. RefDatum (da wo die Erkrankung aufgetreten ist) und Zahlen für genesen:

NOW=`date +"%d.%m.%g %H:%M.%S"`
NOWDAT=`date +"%d_%m_%g"`
USER=DBUSER
PASS=DBPASSWORD

rm /var/skripte/data/cor*.csv
#wget -O /var/skripte/data/cor_rki.csv https://opendata.arcgis.com/datasets/dd4580c810204019a7b8eb3e0b329dd6_0.csv
python3 -u /var/skripte/rkijson.py
wget -O /var/skripte/data/cor_landkreise.csv https://opendata.arcgis.com/datasets/917fc37a709542548cc3be077a786c17_0.csv
wget -O /var/skripte/data/cor_bundesland.csv https://opendata.arcgis.com/datasets/ef4b445a53c1406892257fe63129a8ea_0.csv

cp /var/skripte/data/cor_rki.csv /var/skripte/data/rki_$NOWDAT.csv.backup
cp /var/skripte/data/cor_landkreise.csv /var/skripte/data/landkreise_$NOWDAT.csv.backup
cp /var/skripte/data/cor_bundesland.csv /var/skripte/data/bundesland_$NOWDAT.csv.backup

#mysql -u $USER -p$PASS iobroker < /var/skripte/data/createTable.txt

mysqlimport --fields-terminated-by=, --ignore-lines=1 --verbose --delete --local -u $USER -p$PASS iobroker /var/skripte/data/cor_rki.csv
mysqlimport --fields-terminated-by=, --ignore-lines=1 --verbose --delete --local -u $USER -p$PASS iobroker /var/skripte/data/cor_landkreise.csv
mysqlimport --fields-terminated-by=, --ignore-lines=1 --verbose --delete --local -u $USER -p$PASS iobroker /var/skripte/data/cor_bundesland.csv

mysql -u $USER -p$PASS iobroker < /var/skripte/data/createZiel.txt

rkijson.py:

import csv, json
import datetime as dt
import requests

outfile = r'/var/skripte/data/cor_rki.csv'

count = "https://services7.arcgis.com/mOBPykOjAyBO2ZKk/arcgis/rest/services/RKI_COVID19/FeatureServer/0/query?where=1%3D1&outFields=*&returnCountOnly=true&f=pjson"
anz = requests.get(count)
anz_json = json.loads(anz.text)
anzahl = anz_json['count']
print("Zeilen:" + str(anzahl))

ofile = open(outfile, 'w+')
output = csv.writer(ofile)

search1 = "https://services7.arcgis.com/mOBPykOjAyBO2ZKk/arcgis/rest/services/RKI_COVID19/FeatureServer/0/query?where=1%3D1&outFields=*&resultOffset="
search2 = "&resultRecordCount=1000&f=pjson"
i = 0
while i < anzahl:
    print("Readfile:" + str((int)(i / 1000)) + " von " + str((int)(int(anzahl) / 1000)))
    s_str = search1 + str(i) + search2
    x = requests.get(s_str)
    data = json.loads(x.text)

    daten = data['features']
    for row in daten:
        zeit = row['attributes']['Meldedatum'] / 1000
        row['attributes']['Meldedatum'] = dt.datetime.utcfromtimestamp(zeit).strftime(
            "%Y-%m-%dT%H:%M:%S.000Z")
        meld = row['attributes']['Refdatum'] / 1000
        row['attributes']['Refdatum'] = dt.datetime.utcfromtimestamp(meld).strftime(
            "%Y-%m-%dT%H:%M:%S.000Z")
        dat = row['attributes']['Datenstand']
        row['attributes']['Datenstand'] = dat.replace(",",":")
    if i == 0:
        output.writerow(daten[0]['attributes'].keys())
    for row in data['features']:
        output.writerow(row['attributes'].values())
    i = i + 1000

createTable.txt:

CREATE TABLE IF NOT EXISTS cor_rki(
   IdBundesland    INTEGER  NOT NULL
  ,Bundesland      VARCHAR(44) NOT NULL
  ,Landkreis       VARCHAR(44) NOT NULL
  ,Altersgruppe    VARCHAR(9) NOT NULL
  ,Geschlecht      VARCHAR(9) NOT NULL
  ,AnzahlFall      INTEGER  NOT NULL
  ,AnzahlTodesfall INTEGER  NOT NULL
  ,ObjectId        INTEGER  NOT NULL PRIMARY KEY
  ,Meldedatum      VARCHAR(24) NOT NULL
  ,IdLandkreis     VARCHAR(5) NOT NULL
  ,Datenstand      VARCHAR(22) NOT NULL
  ,NeuerFall       INTEGER  NOT NULL
  ,NeuerTodesfall  INTEGER  NOT NULL
  ,Refdatum        VARCHAR(24) NOT NULL
  ,NeuGenesen      INTEGER  NOT NULL
  ,AnzahlGenesen   INTEGER  NOT NULL
) DEFAULT CHARACTER SET = UTF8;

ALTER TABLE `cor_rki`
  ADD KEY `Meldedatum` (`Meldedatum`),
  ADD KEY `IdLandkreis` (`IdLandkreis`),
  ADD KEY `Datenstand` (`Datenstand`),
  ADD KEY `Refdatum` (`Refdatum`);
COMMIT;

CREATE TABLE IF NOT EXISTS cor_landkreise(
   OBJECTID             INTEGER  NOT NULL PRIMARY KEY
  ,ADE                  INTEGER
  ,GF                   INTEGER
  ,BSG                  BIT
  ,RS                   VARCHAR(5) NOT NULL
  ,AGS                  VARCHAR(5)
  ,SDV_RS               VARCHAR(11)
  ,GEN                  VARCHAR(44) NOT NULL
  ,BEZ                  VARCHAR(44) NOT NULL
  ,IBZ                  INTEGER
  ,BEM                  VARCHAR(13)
  ,NBD                  VARCHAR(4)
  ,SN_L                 INTEGER
  ,SN_R                 INTEGER
  ,SN_K                 INTEGER
  ,SN_V1                INTEGER
  ,SN_V2                INTEGER
  ,SN_G                 INTEGER
  ,FK_S3                VARCHAR(1)
  ,NUTS                 VARCHAR(5)
  ,RS_0                 INTEGER
  ,AGS_0                INTEGER
  ,WSK                  VARCHAR(23)
  ,EWZ                  INTEGER  NOT NULL
  ,KFL                  NUMERIC(7,2)
  ,DEBKG_ID             VARCHAR(16)
  ,Shape_Area           NUMERIC(17,7) NOT NULL
  ,Shape_Length         NUMERIC(17,10) NOT NULL
  ,death_rate           NUMERIC(17,15) NOT NULL
  ,cases                INTEGER  NOT NULL
  ,deaths               INTEGER  NOT NULL
  ,cases_per_100k       NUMERIC(17,14) NOT NULL
  ,cases_per_population NUMERIC(19,17) NOT NULL
  ,BL                   VARCHAR(22) NOT NULL
  ,BL_ID                INTEGER  NOT NULL
  ,county               VARCHAR(36) NOT NULL
  ,last_update          VARCHAR(16) NOT NULL
) DEFAULT CHARACTER SET = UTF8;

ALTER TABLE `cor_landkreise`
  ADD KEY `RS` (`RS`);
COMMIT;

CREATE TABLE IF NOT EXISTS cor_bundesland(
   ID               INTEGER  NOT NULL PRIMARY KEY
  ,LAN_ew_AGS       INTEGER  NOT NULL
  ,LAN_ew_GEN       VARCHAR(44) NOT NULL
  ,LAN_ew_BEZ       VARCHAR(44) NOT NULL
  ,LAN_ew_EWZ       INTEGER  NOT NULL
  ,OBJECTID         INTEGER  NOT NULL
  ,Fallzahl         INTEGER  NOT NULL
  ,Aktualisierung   VARCHAR(24) NOT NULL
  ,AGS_TXT          INTEGER  NOT NULL
  ,GlobalID         VARCHAR(36) NOT NULL
  ,faelle_100000_EW NUMERIC(16,13) NOT NULL
  ,Shape_Area       NUMERIC(17,5) NOT NULL
  ,Shape_Length     NUMERIC(16,9) NOT NULL
  ,Death            INTEGER  NOT NULL
) DEFAULT CHARACTER SET = UTF8;

truncate cor_rki;
truncate cor_bundesland;
truncate cor_landkreise;

createZiel.txt:
Achtung falls ihr die Tabelle cor_datum nicht verwendet, dann die Bezüge hier löschen (Tabelle siehe nächste Post)

DROP TABLE IF EXISTS cor_view;

CREATE TABLE cor_view AS
SELECT
r.IDBundesLand as ID_B, r.IDLandkreis as ID_L,SUBSTRING(r.MeldeDatum,1,10) as R_MeldeDatum, r.ObjectID as ID_R,
r.Bundesland as R_Bundesland, r.Landkreis as R_Landkreis, r.Altersgruppe as R_Alter, r.Geschlecht as R_Geschl, r.AnzahlFall as R_Fall, r.AnzahlTodesfall as R_Tote, r.Datenstand as
 R_Datenstand, r.NeuerFall as R_Neuerfall, r.NeuerTodesFall as R_NeuerTodesFall,
SUBSTRING(r.Refdatum,1,10) as R_Refdatum, r.NeuGenesen as R_NeuGenesen, r.AnzahlGenesen as R_AnzahlGenesen,
b.LAN_ew_EWZ as B_Einwohner,b.FallZahl as B_Fallzahl,b.Death as B_Tote,
l.EWZ as L_Einwohner,l.KFL as L_Flaeche, l.death_rate as L_TodesRate, l.cases as L_Faelle, l.deaths as L_Tote, l.cases_per_100k as L_Faelle_pro_100000,l.cases_per_population as L_
Faelle_pro_Bevoelkerung,
k.skreis as K_SKreis, k.bevoelkerung as K_Bevoelkerung, k.maenner as K_Maenner,k.frauen as K_Frauen, k.dichte as K_Dichte
FROM
cor_rki r,cor_bundesland b,cor_landkreise l, kreise k
where r.IdLandkreis=l.RS and r.IdBundesland=b.id and r.IdLandkreis=k.id
and r.AnzahlFall>0
order by ID_B,ID_L,R_MeldeDatum;

update cor_view set R_Tote=0 where R_Tote<0;
update cor_view set R_AnzahlGenesen=0 where R_AnzahlGenesen<0;

update cor_datum set rki=false;
update cor_datum set rki=true where d_datum<=(select max(R_meldedatum) from cor_view) and d_datum>=(select min(R_meldedatum) from cor_view);

ALTER TABLE `cor_view`
  ADD UNIQUE KEY `PRIME` (`ID_B`,`ID_L`,`R_MeldeDatum`,`ID_R`) USING BTREE,
  ADD KEY `I1` (`R_MeldeDatum`,`R_Bundesland`,`R_Fall`,`R_Tote`),
  ADD KEY `I2` (`R_MeldeDatum`,`R_Landkreis`,`R_Fall`,`R_Tote`),
  ADD KEY `I3` (`R_MeldeDatum`,`K_SKreis`,`R_Fall`,`R_Tote`);
COMMIT;

sissiwup

Um einfacher Abfragen zu können habe ich eine Tabelle:

cor_datum angelegt, hier sind die vorhandenen Datumswerte markiert:

cor_datum.sql

grafana:

ioBroker Corona-1586463967124.json

Wenn ihr im json R_meldedatum durch R_refdatum ersetz, dann bekommt ihr die Kurven nach Erkrankungsdatum und nicht nach Meldedatum.

Community Forum

NEWS

Corona-Daten nach MySQL importieren

Support us

313

32.6k

82.2k

1.3m