Projekt Wetter und Klima

Nein … ich bin weder Klimaskeptiker noch Klimaleugner, noch stelle ich eine subjektiv erlebbare Erderwärmung in Frage. Was mich treibt in diesem Projekt ist die Neugierde, ob eine nüchterne und objektive Betrachtung der Datenlage dazu führt zu Ergebnissen zu gelangen, die mit denen in den Medien korrelieren . Schlussfolgerungen daraus überlasse ich anderen, ich liefere lediglich die Daten dazu und 

Welche Daten sind das und wie kann PowerBI dabei helfen, diese managen und vernünftig zu visualisieren? Das war der Antrieb und zusätzlich wollte ich mich schon immer sehr gerne mich recht großem Datenvolumen zu befassen.

Die Datenquellen sind komplett und ohne Ausnahme online verfügbar. Für die Dimensionstabellen (Staaten, Ländern, geographische oder politische Zuodnung) benutze ich zahlreiche Quellen. Die Wetterstationsliste stammt von der WMO selber und enthält eine Stationsliste im 5-stelligen Bereich.

Ziel: Wetterdaten (Temperatur und Regen) für einen Zeitraum ab 1991 zu sammeln, diese zu Monatsdurchschnitten zu aggregieren und die Daten in zwei Töpfe zu zerlegen: 1) Referenzzeitraum – ein 20 Jahre Intervall von 1991 bis 2010 und ein 2) Beobachtungszeitraum ab 2011, der mit den ermittelten Durchschnitten als Referenz verglichen werden kann mit Selektionsmöglichkeiten (Staaten, Klimazonen, Kontinente, Länder, bis zur kleinsten Einheit, der Wetterstation selber.

Datenquellen der Facttables: Ich habe mich zweier Quellen bedient. Daten des Deutschen Wetterdienstes (DWD) (als Abruf/Download) und einer Schnittstelle zu meteostat. Die primäre Quelle sind die täglichen Temperaturen und Niederschlagsmengen von meteostat. Diesen Job erledigt ein Python Skript auf meinem MYSQL Server sehr zuverlässig, der die bis zu 15.000 Tagesdatensätze zu Monatsschnitten umrechnet und diese für PBI vorhält. Die Daten des DWD dienen als Backup und erhalten keine granularen Tagesdaten mehr. Sie sind bereits zu Monatsschnitten aggregiert.

Warum ein Backup? Die Daten sind nicht immer vollständig, es gibt Monate und Stationen für die liegen keine regelmässigen Daten vor oder die Daten weisen große Lücken auf. Deswegen fülle ich Lücken durch ggfs. vorhandene Daten des DWD auf.

Kompromiss: Ich fixiere mich in meiner Darstellung nur auf Stationen, zu denen ich auch aktuelle Daten habe, die also noch in Betrieb und bereits lange genug im Betrieb sind. Diese „qualifizierten“ Wetterstationen nehme ich dann in die Berichtsfilterung auf, alle weiteren (neuen oder solche mit unvollständigen Daten oder nicht mehr betriebene Stationen werden ausgeblendet.

Filtermenge: Zur Zeit ca. 4.430 Wetterstationen

Durchschnitte: Ein kurzer Blick auf die Karte zeigt bereits ein Dilemma. Die zahlreichen Punkte, die jede für sich eine Wetterstation darstellen, sind nicht gleichmäßig verteilt, im Gegenteil. Die Industrienationen in Europa und den USA sind deutlich überrepräsentiert. Das heißt ein – wie auch immer berechneter Durchschnitt – ist tendenziell durch die überrepräsentierten Regionen in der Gesamtmenge schief! Eine feine Filterung auf ein einzelnes Land (Deutschland) sollte dann aber schon wieder ganz ordentlich funktionieren.

In einem Update werde ich dieses einmal angehen und die Stationen in gleichgroßen Gebieten clustern, so dass das Ergebnis global aussagefähiger wird.

Ein weiterer Nachteil ist, dass Wetterstationen natürlich auf der Landmasse zu finden sind. Wetterstationen werden nicht auf dem Wasser errichtet. Die Messwerte von „Wetterbojen“ sind deswegen in der Datenmenge überhaupt nicht enthalten. Das bedeutet dann wiederum: Globale Aussagen können nur für die Landmassen gemacht werden. Die Meeresflächen fehlen.

Nichtsdestotrotz ist es wärmer geworden und wenn Sie Spaß daran haben, spielen Sie einmal mit dem Modell. Filtern Sie sich in Ihre Nachbarschaft und Ihre Region. Bestätigen Sie Ihre Wahrnehmung von einem kalten Winter oder heißen Sommer in 2015 oder widerlegen Sie die. Nutzen Sie die zahlreichen „Tooltips“ bei denen sich weitere Informationen und Animationen verbergen.

 

Sie sehen schon ohne in die Details zu gehen – auch in diesem Modell steckt jede Menge drin!

Brauchen Sie Unterstützung oder Hilfe in Ihrem Power BI Projekt? Kontaktieren Sie mich!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert