Landwirte, die ihren Acker effizient bewirtschaften, können ihre Ernteerträge maximieren. Beim Begriff Data Farming stehen die Daten stellvertretend für die Ernteerträge, das Acker ist ein Simulationsmodell und das Bewirtschaften steht für eine Vielzahl von Experimenten. Beim Data Farming werden auf Basis von Computerexperimenten Daten „gezüchtet“ bzw. Datenmengen vergrößert, die dann mit statistischen Verfahren oder Machine Learning Ansätzen analysiert und visualisiert werden können. Ziel ist es, Einblicke in komplexe Systeme zu erhalten und bisher unbekannte Wirkzusammenhänge aufzuzeigen.
In Zeiten der Digitalisierung stehen Big Data, Cloud Computing, Business Intelligence und Forecastings hoch im Kurs. Häufiges Problem bei der Umsetzung sind fehlende, unvollständige oder nicht konsistente Daten. Um dieses Problem zu lösen, können mit Hilfe des Data Farmings sogenannte synthetische Daten erstellt werden. Diese bauen auf den realen Daten auf, schließen Lücken, erschließen neue Wirkzusammenhänge und verbessern damit den Datensatz bzw. den „Ernteertrag“.
In der logistischen Praxis sind Simulationsmodelle (oder auch Digital Twins) meist der Ausgangspunkt für den Data Farming Prozess, denn Simulation ist ein etabliertes Werkzeug zur Planung und Steuerung komplexer Produktions- und Logistiksysteme. Das Simulationsmodell bildet die aktuellen Prozesse ab und ermöglicht Experimente, mit Hilfe derer Daten vergrößert werden. Dabei sollten die Experimente eine große Bandbreite abdecken und einem intelligenten Design folgen. So können bisher unbekannte Wirkzusammenhänge durch Data Farming aufgedeckt und Datenlücken geschlossen werden. Im Ergebnis wird der Entscheidungsprozess im Unternehmen unterstützt, in dem die beste Lösung oder Option aufgezeigt wird.
Das Data Farming ist ein iterativer Prozess aus Prototyping, Simulation, Experimentplanung, Analyse und Visualisierung – und damit sind wir beim Hauptkritikpunkt, denn aktuell braucht es für gute und zielführende Ergebnisse immer Data Farming Expertinnen/Experten, die individuelle Modelle und IT-Umgebungen aufbauen, Simulationen durchführen und Daten ergänzen. Es gibt kein einheitliches Framework oder Softwarepaket für den Data Farming Prozess oder ein genormtes Vorgehen, das auch für Menschen aus anderen Fachbereichen nachvollziehbar und umsetzbar ist. Letztendlich tritt dieses Problem aber bei den meisten neuen Technologien und Methoden auf und es ist nur eine Frage der Zeit, bis der breiter Transfer in die betriebliche Praxis möglich ist.