Maschinelles Lernen (ML) & Deep Learning
1 | Kurz gesagt
Maschinelles Lernen bezeichnet Algorithmen, die aus Beispieldaten Regeln ableiten – statt hart einprogrammiert zu werden. Deep Learning ist eine besonders leistungsfähige Unterkategorie mit vielen Schichten („deep“) künstlicher Neuronen.
2 | Typische Verfahren
Kategorie | Algorithmen | Wasserwirtschaftliche Aufgaben |
---|---|---|
Überwachtes Lernen | Lineare / logistische Regression, Random‑Forest, Gradient‑Boosting | Leckage‑Erkennung, Pumpenausfallprognose |
Zeitreihen‑Modelle | LSTM‑Netz, GRU, Prophet | Last‑ & Verbrauchsvorhersage, Niederschlagsabfluss |
Unüberwachtes Lernen | K‑Means, DBSCAN, Autoencoder | Anomalie‑Detektion, Clusterung von Betriebszuständen |
Deep Learning | CNN (Bilder), Transformer (Sequenzen) | Kamera‑gestützte Schmutzfrachtanalyse, Spektralsonden‑Auswertung |
3 | Daten‑Pipeline in fünf Schritten
- Erfassen – Sensor‑, SCADA‑ & Labordaten konsolidieren
- Bereinigen – Ausreißer & Lücken behandeln
- Feature‑Engineering – Hydraulische Kennzahlen, saisonale Flags, Lag‑Features
- Trainieren – Cross‑Validation, Hyperparameter‑Tuning
- Deployen & Re‑Training – Docker / Kubernetes oder Edge‑Device; Monitoring der Modellgüte
4 | Praxisbeispiel
Im EU‑Projekt Digital Water City sagt ein ML‑Modell kombinierte Regenüberläufe (CSO) in Berlin bis zu zwei Stunden vor Eintritt voraus. Betreiber drosseln Zuläufe, verringern Mischwassereinleitungen und sparen Reinigungskosten. digital-water.citydigital-water.city
5 | Schnell‑Check
- Liegen ≥ 24 Monate durchgängige Prozessdaten vor?
- Existiert ein anonymisierter Testdatensatz zur Validierung?
- Ist ein Roll‑back‑Plan definiert, falls das Modell ausfällt?
6 | Häufige Stolpersteine
- Daten‑Bias: Wartungsberichte fehlen, obwohl Pumpen defekt waren.
- Überanpassung: Modell glänzt im Labor, versagt in Hitzesommern.
- Schlechte Übergabe: IT übernimmt Modell, aber Betrieb kennt keine Kennzahlen.
Digitale Zwillinge
1 | Definition
Ein digitaler Zwilling ist ein virtuelles, laufend synchronisiertes Abbild einer Anlage, eines Netzes oder sogar einzelner Bauwerke. Sensordaten fließen in das Simulationsmodell, das umgekehrt Optimierungs‑ und Steuerungsvorschläge zurückgibt.
2 | Zwilling‑Typen
Typ | Schwerpunkt | Beispiel‑KPI |
---|---|---|
Prozess‑Zwilling | Biologie & Chemie in Kläranlagen | kWh / kg N entfernt |
Hydraulik‑Zwilling | Druck & Durchfluss in Netzen | l/s Leckage‑Rate |
Asset‑Zwilling | Zustand einzelner Pumpwerke | MTBF, OPEX pro Jahr |
3 | Implementierung (4‑Phasen‑Modell)
- Datenaufnahme – Bauwerks‑ & Prozessdaten digitalisieren
- Modellkalibrierung – Historische Messungen zum Abgleich nutzen
- Echtzeit‑Kopplung – SCADA‑Schnittstelle, MQTT oder OPC UA
- Optimierung & Kontrolle – Was‑wäre‑wenn‑Szenarien, automatisierte Stellbefehle
4 | Praxisbeispiel
Bei EWE Wasser in Cuxhaven spart ein Echtzeit‑Prozesszwilling jährlich rund 150 000 € an Energie (≈ 1 Mio. kWh) durch adaptive Belüftungssteuerung. Das Modell wurde gemeinsam mit Xylem entwickelt und läuft auf einer hybriden Cloud‑Edge‑Architektur. Xylem
5 | Tool‑Landscape (Auswahl)
- Xylem Vue powered by GoAigua – SaaS‑Plattform für Netz‑ & Anlagen‑Zwillinge
- AquaSuite (Royal HaskoningDHV) – KI‑basierte Prozesssteuerung
- Open‑Source: EPANET, DWA‑WorkBench plus Python‑Schnittstellen
Predictive Analytics
1 | Konzept
Predictive Analytics nutzt historische & Live‑Daten, um Wahrscheinlichkeiten für künftige Ereignisse oder Trends zu berechnen. Ergebnis sind Klick‑fertige Prognosen (z. B. „Pumpe 3 fällt in 19 Tagen mit 78 % Wahrscheinlichkeit aus.“).
2 | Typische Anwendungsfelder
Feld | Datengrundlage | Möglicher Nutzen |
---|---|---|
Pumpen‑/Motor‑Ausfall | Vibrations‑ & Stromdaten | Wartung 2‑4 Wochen früher, weniger Not‑Einsätze |
Ablaufqualität | Online‑Sensoren, Wetterdaten | Vermeidung von Grenzwertverletzungen |
Strompreis‑Optimierung | Börsendaten + Lastprofil | Betrieb last‑ & preisorientiert schieben |
3 | Praxisbeispiel
Im BMBF‑Verbund KAbit koppeln Forscher:innen Online‑Gas‑ und Prozessmessungen mit prädiktiven ML‑Modellen, um Lachgas‑ und Methan‑Emissionen im Belebungsbecken zu minimieren und gleichzeitig Energie zu sparen. Ruhrverbandfona.de
4 | Technische Zutaten
- Zeitreihen‑Datenbank (InfluxDB, TimescaleDB)
- Feature‑Store (Redis, Feast)
- AutoML‑Service für Hyperparameter‑Tuning
- Dashboard‑Tool (Grafana, Power BI)
5 | Best Practice
- Rolling‑Window‑Validierung statt starrer Test‑/Train‑Splits
- Prognosehorizont an Prozessträgheit anpassen (Sekunden bis Tage)
- Alarm‑Schwellen gemeinsam mit Betrieb definieren
IoT‑ & Edge‑Sensorik
1 | Grundidee
IoT‑Sensoren sind vernetzte, oft batteriebetriebene Messknoten. „Edge Computing“ bedeutet, dass erste Analysen direkt auf dem Sensor‑Gateway laufen – Datenflut und Latenz sinken.
2 | Typische Messgrößen & Protokolle
Messgröße | Typische Sensoren | Funk‑/Netz‑Protokolle |
---|---|---|
Druck & Durchfluss | Ultraschall, elektromagnetisch | NB‑IoT, LoRaWAN |
Wasserqualität | Spektrometer, Ion‑selektive Elektroden | 4G/LTE, MQTT |
Niederschlag, Pegel | Radar, Ultraschall, Kamera | 5G, Edge‑AI‑Module |
3 | Praxisbeispiel
Das TU‑Dresden‑Projekt KIWA verknüpft Kameras, Pegel‑ und Wettersensoren mit edge‑basierten ML‑Modellen, um Hochwasser 60–90 Minuten früher zu melden und Alarmketten automatisch zu starten. TU Dresden
4 | Architektur‑Skizze
- Sensorlayer – LoRaWAN‑Nodes, Batterielaufzeit > 5 Jahre
- Edge‑Gateway – Nvidia Jetson / Raspberry Pi, lokales ML‑Inferencing
- Backhaul – 4G/5G oder Glasfaser ins Rechenzentrum
- Cloud/SCADA – Langzeit‑Storage, Visualisierung, Alarmierung
5 | Tipps für die Praxis
- Antenne & Gehäuse an lokale Funkabdeckung anpassen
- Energiebudget (Solar vs. Netzspannung) früh klären
- OTA‑Update‑Fähigkeit einplanen
Datenmanagement & Big Data
1 | Warum ein Daten‑Backbone?
Ohne saubere, greifbare Daten bleiben KI‑Modelle Spielzeug. Ein Big‑Data‑fester Unterbau sammelt, sichert und strukturiert Rohdaten – egal ob aus SCADA, Labor oder IoT‑Feldbus.
2 | Schichtenmodell
Layer | Aufgabe | Tools & Standards |
---|---|---|
Ingestion | Daten aufnehmen, streamen | OPC UA, MQTT, Kafka |
Storage | Roh‑ & Aggregatdaten speichern | Data Lake (S3, HDFS) + Time‑Series‑DB |
Processing | ETL/ELT, Feature‑Engineering | Spark, Flink, dbt |
Governance | Qualität, Sicherheit, Metadaten | ISO 27001, FAIR‑Prinzipien |
Access | Dashboards, ML‑API | Grafana, Power BI, Feast |
3 | Praxisbeispiel
Im Rahmen von Digital Water City baut die Berliner Wasserbetriebe einen zentralen Data‑Lake auf, der IoT‑Sensorik, Labordaten und Spatio‑Daten integriert und als Basis für mehrere ML‑Services dient. digital-water.city
4 | Förderprogramme & Standards
- BMBF „Digital GreenTech“ – unterstützt datengetriebene Umwelttechnik‑Projekte, Schwerpunkt Wasser.
- EU‑Cloud‑Regelwerk (GDPR, Data Act) beachten
- DVGW‑Arbeitsblatt W 1100 für IT‑Security
5 | Quick‑Wins
- Time‑Series‑DB neben dem bestehenden SQL‑Server aufsetzen
- Change‑Data‑Capture nutzen, um SCADA‑Änderungen automatisch zu replizieren
- Data‑Catalog (z. B. Open Meta‑Data) für schnelle Suche nach Messpunkten

Weiter zu › Anwendungsfälle
Dort zeigen wir, wie Sie die hier vorgestellten Technologien in Pumpwerken, Kläranlagen und Leitnetzzentralen konkret einsetzen.