Technologien & Methoden

Maschinelles Lernen (ML) & Deep Learning

1 | Kurz gesagt

Maschinelles Lernen bezeichnet Algorithmen, die aus Beispieldaten Regeln ableiten – statt hart einprogrammiert zu werden. Deep Learning ist eine besonders leistungsfähige Unterkategorie mit vielen Schichten („deep“) künstlicher Neuronen.

2 | Typische Verfahren

Kategorie	Algorithmen	Wasserwirtschaftliche Aufgaben
Überwachtes Lernen	Lineare / logistische Regression, Random‑Forest, Gradient‑Boosting	Leckage‑Erkennung, Pumpenausfallprognose
Zeitreihen‑Modelle	LSTM‑Netz, GRU, Prophet	Last‑ & Verbrauchsvorhersage, Niederschlagsabfluss
Unüberwachtes Lernen	K‑Means, DBSCAN, Autoencoder	Anomalie‑Detektion, Clusterung von Betriebszuständen
Deep Learning	CNN (Bilder), Transformer (Sequenzen)	Kamera‑gestützte Schmutzfrachtanalyse, Spektralsonden‑Auswertung

3 | Daten‑Pipeline in fünf Schritten

Erfassen – Sensor‑, SCADA‑ & Labordaten konsolidieren
Bereinigen – Ausreißer & Lücken behandeln
Feature‑Engineering – Hydraulische Kennzahlen, saisonale Flags, Lag‑Features
Trainieren – Cross‑Validation, Hyperparameter‑Tuning
Deployen & Re‑Training – Docker / Kubernetes oder Edge‑Device; Monitoring der Modellgüte

4 | Praxisbeispiel

Im EU‑Projekt Digital Water City sagt ein ML‑Modell kombinierte Regenüberläufe (CSO) in Berlin bis zu zwei Stunden vor Eintritt voraus. Betreiber drosseln Zuläufe, verringern Mischwassereinleitungen und sparen Reinigungskosten. digital-water.city digital-water.city

5 | Schnell‑Check

Liegen ≥ 24 Monate durchgängige Prozessdaten vor?
Existiert ein anonymisierter Testdatensatz zur Validierung?
Ist ein Roll‑back‑Plan definiert, falls das Modell ausfällt?

6 | Häufige Stolpersteine

Daten‑Bias: Wartungsberichte fehlen, obwohl Pumpen defekt waren.
Überanpassung: Modell glänzt im Labor, versagt in Hitzesommern.
Schlechte Übergabe: IT übernimmt Modell, aber Betrieb kennt keine Kennzahlen.

Digitale Zwillinge

1 | Definition

Ein digitaler Zwilling ist ein virtuelles, laufend synchronisiertes Abbild einer Anlage, eines Netzes oder sogar einzelner Bauwerke. Sensordaten fließen in das Simulationsmodell, das umgekehrt Optimierungs‑ und Steuerungsvorschläge zurückgibt.

2 | Zwilling‑Typen

Typ	Schwerpunkt	Beispiel‑KPI
Prozess‑Zwilling	Biologie & Chemie in Kläranlagen	kWh / kg N entfernt
Hydraulik‑Zwilling	Druck & Durchfluss in Netzen	l/s Leckage‑Rate
Asset‑Zwilling	Zustand einzelner Pumpwerke	MTBF, OPEX pro Jahr

3 | Implementierung (4‑Phasen‑Modell)

Datenaufnahme – Bauwerks‑ & Prozessdaten digitalisieren
Modellkalibrierung – Historische Messungen zum Abgleich nutzen
Echtzeit‑Kopplung – SCADA‑Schnittstelle, MQTT oder OPC UA
Optimierung & Kontrolle – Was‑wäre‑wenn‑Szenarien, automatisierte Stellbefehle

4 | Praxisbeispiel

Bei EWE Wasser in Cuxhaven spart ein Echtzeit‑Prozesszwilling jährlich rund 150 000 € an Energie (≈ 1 Mio. kWh) durch adaptive Belüftungssteuerung. Das Modell wurde gemeinsam mit Xylem entwickelt und läuft auf einer hybriden Cloud‑Edge‑Architektur. Xylem

5 | Tool‑Landscape (Auswahl)

Xylem Vue powered by GoAigua – SaaS‑Plattform für Netz‑ & Anlagen‑Zwillinge
AquaSuite (Royal HaskoningDHV) – KI‑basierte Prozesssteuerung
Open‑Source: EPANET, DWA‑WorkBench plus Python‑Schnittstellen

Predictive Analytics

1 | Konzept

Predictive Analytics nutzt historische & Live‑Daten, um Wahrscheinlichkeiten für künftige Ereignisse oder Trends zu berechnen. Ergebnis sind Klick‑fertige Prognosen (z. B. „Pumpe 3 fällt in 19 Tagen mit 78 % Wahrscheinlichkeit aus.“).

2 | Typische Anwendungsfelder

Feld	Datengrundlage	Möglicher Nutzen
Pumpen‑/Motor‑Ausfall	Vibrations‑ & Stromdaten	Wartung 2‑4 Wochen früher, weniger Not‑Einsätze
Ablaufqualität	Online‑Sensoren, Wetterdaten	Vermeidung von Grenzwertverletzungen
Strompreis‑Optimierung	Börsendaten + Lastprofil	Betrieb last‑ & preisorientiert schieben

3 | Praxisbeispiel

Im BMBF‑Verbund KAbit koppeln Forscher:innen Online‑Gas‑ und Prozessmessungen mit prädiktiven ML‑Modellen, um Lachgas‑ und Methan‑Emissionen im Belebungsbecken zu minimieren und gleichzeitig Energie zu sparen. Ruhrverband fona.de

4 | Technische Zutaten

Zeitreihen‑Datenbank (InfluxDB, TimescaleDB)
Feature‑Store (Redis, Feast)
AutoML‑Service für Hyperparameter‑Tuning
Dashboard‑Tool (Grafana, Power BI)

5 | Best Practice

Rolling‑Window‑Validierung statt starrer Test‑/Train‑Splits
Prognosehorizont an Prozessträgheit anpassen (Sekunden bis Tage)
Alarm‑Schwellen gemeinsam mit Betrieb definieren

IoT‑ & Edge‑Sensorik

1 | Grundidee

IoT‑Sensoren sind vernetzte, oft batteriebetriebene Messknoten. „Edge Computing“ bedeutet, dass erste Analysen direkt auf dem Sensor‑Gateway laufen – Datenflut und Latenz sinken.

2 | Typische Messgrößen & Protokolle

Messgröße	Typische Sensoren	Funk‑/Netz‑Protokolle
Druck & Durchfluss	Ultraschall, elektromagnetisch	NB‑IoT, LoRaWAN
Wasserqualität	Spektrometer, Ion‑selektive Elektroden	4G/LTE, MQTT
Niederschlag, Pegel	Radar, Ultraschall, Kamera	5G, Edge‑AI‑Module

3 | Praxisbeispiel

Das TU‑Dresden‑Projekt KIWA verknüpft Kameras, Pegel‑ und Wettersensoren mit edge‑basierten ML‑Modellen, um Hochwasser 60–90 Minuten früher zu melden und Alarmketten automatisch zu starten. TU Dresden

4 | Architektur‑Skizze

Sensorlayer – LoRaWAN‑Nodes, Batterielaufzeit > 5 Jahre
Edge‑Gateway – Nvidia Jetson / Raspberry Pi, lokales ML‑Inferencing
Backhaul – 4G/5G oder Glasfaser ins Rechenzentrum
Cloud/SCADA – Langzeit‑Storage, Visualisierung, Alarmierung

5 | Tipps für die Praxis

Antenne & Gehäuse an lokale Funkabdeckung anpassen
Energiebudget (Solar vs. Netzspannung) früh klären
OTA‑Update‑Fähigkeit einplanen

Datenmanagement & Big Data

1 | Warum ein Daten‑Backbone?

Ohne saubere, greifbare Daten bleiben KI‑Modelle Spielzeug. Ein Big‑Data‑fester Unterbau sammelt, sichert und strukturiert Rohdaten – egal ob aus SCADA, Labor oder IoT‑Feldbus.

2 | Schichtenmodell

Layer	Aufgabe	Tools & Standards
Ingestion	Daten aufnehmen, streamen	OPC UA, MQTT, Kafka
Storage	Roh‑ & Aggregatdaten speichern	Data Lake (S3, HDFS) + Time‑Series‑DB
Processing	ETL/ELT, Feature‑Engineering	Spark, Flink, dbt
Governance	Qualität, Sicherheit, Metadaten	ISO 27001, FAIR‑Prinzipien
Access	Dashboards, ML‑API	Grafana, Power BI, Feast

3 | Praxisbeispiel

Im Rahmen von Digital Water City baut die Berliner Wasserbetriebe einen zentralen Data‑Lake auf, der IoT‑Sensorik, Labordaten und Spatio‑Daten integriert und als Basis für mehrere ML‑Services dient. digital-water.city

4 | Förderprogramme & Standards

BMBF „Digital GreenTech“ – unterstützt datengetriebene Umwelttechnik‑Projekte, Schwerpunkt Wasser.
EU‑Cloud‑Regelwerk (GDPR, Data Act) beachten
DVGW‑Arbeitsblatt W 1100 für IT‑Security

5 | Quick‑Wins

Time‑Series‑DB neben dem bestehenden SQL‑Server aufsetzen
Change‑Data‑Capture nutzen, um SCADA‑Änderungen automatisch zu replizieren
Data‑Catalog (z. B. Open Meta‑Data) für schnelle Suche nach Messpunkten

Weiter zu › Anwendungsfälle
Dort zeigen wir, wie Sie die hier vorgestellten Technologien in Pumpwerken, Kläranlagen und Leitnetzzentralen konkret einsetzen.

Technologien & Methoden

Maschinelles Lernen (ML) & Deep Learning

1 | Kurz gesagt

2 | Typische Verfahren

3 | Daten‑Pipeline in fünf Schritten

4 | Praxisbeispiel

5 | Schnell‑Check

6 | Häufige Stolpersteine

Digitale Zwillinge

1 | Definition

2 | Zwilling‑Typen

3 | Implementierung (4‑Phasen‑Modell)

4 | Praxisbeispiel

5 | Tool‑Landscape (Auswahl)

Predictive Analytics

1 | Konzept

2 | Typische Anwendungsfelder

3 | Praxisbeispiel

4 | Technische Zutaten

5 | Best Practice

IoT‑ & Edge‑Sensorik

1 | Grundidee

2 | Typische Messgrößen & Protokolle

3 | Praxisbeispiel

4 | Architektur‑Skizze

5 | Tipps für die Praxis

Datenmanagement & Big Data

1 | Warum ein Daten‑Backbone?

2 | Schichten­modell

3 | Praxisbeispiel

4 | Förderprogramme & Standards

5 | Quick‑Wins

Technologien & Methoden

Maschinelles Lernen (ML) & Deep Learning

1 | Kurz gesagt

2 | Typische Verfahren

3 | Daten‑Pipeline in fünf Schritten

4 | Praxisbeispiel

5 | Schnell‑Check

6 | Häufige Stolpersteine

1 | Definition

2 | Zwilling‑Typen

3 | Implementierung (4‑Phasen‑Modell)

4 | Praxisbeispiel

5 | Tool‑Landscape (Auswahl)

Predictive Analytics

1 | Konzept

2 | Typische Anwendungsfelder

3 | Praxisbeispiel

4 | Technische Zutaten

5 | Best Practice

1 | Grundidee

2 | Typische Messgrößen & Protokolle

3 | Praxisbeispiel

4 | Architektur‑Skizze

5 | Tipps für die Praxis

Datenmanagement & Big Data

1 | Warum ein Daten‑Backbone?

2 | Schichtenmodell

3 | Praxisbeispiel

4 | Förderprogramme & Standards

5 | Quick‑Wins