Effizienz in Advanced Analytics-Projekten – Learnings der letzten Jahre

24.08.21

Advanced Analytics

Advanced Analytics ist eines der Hype-Themen der letzten Jahre. Gemeinsam mit unseren Kunden haben wir Know-how aufgebaut, Use Cases im Labor auf Machbarkeit und Wirtschaftlichkeit geprüft oder Datenprodukte in einer produktiven Umgebung entwickelt und wartbar gemacht. Bei Advanced Analytics-Projekten geht es meistens darum, bestimmte Prozesse und Entscheidungen effizienter zu gestalten und damit auch das gesamte Unternehmen. Doch um das zu schaffen, muss die Entwicklung entsprechender Advanced Analytics-Lösungen wirkungsvoll umgesetzt werden. In diesem Blogbeitrag teilen wir einige unserer Learnings, um möglichst effiziente und Mehrwert bringende Advanced Analytics-Projekte abzuschließen.

Drucken

LEARNING 1 - DIE „RICHTIGE“ TEAMSTRUKTUR AKA EFFIZIENTER EINSATZ VON RESSOURCEN

Machine Learning Engineer, Data Scientist, Data Engineer, DevOps Developer, Business Analyst etc. – die Anzahl möglicher Jobbezeichnungen und damit einhergehende Verantwortlichkeiten ist hoch und verwirrend. Schon im Recruiting haben Interessenten und Arbeitgeber häufig unterschiedliche Definitionen von den Rollen und deren Erwartungen an diese. Auch im Umgang mit Softwareherstellern, Beratungsfirmen oder anderen Unternehmen ist es häufig eine der ersten Aufgaben ein gemeinsames Vokabular zu schaffen.

Advanced Analytics ist ein Teamsport. Nur wenige Arbeitskräfte im Markt haben das Know-how, um als sogenannte „Full Stack Developer“ alle Teile eines Advanced Analytics-Lebenszyklus, von der Ideenfindung über das Lab, der Industrialisierung bis hin zum Betrieb, abzudecken. Dafür sind die Technologien und Möglichkeiten in diesem Bereich zu schnelllebig. In den letzten Jahren haben unsere Kunden und auch wir gelernt, eher gut ergänzende Teams aufzubauen, anstatt nach den zwei bis drei „Einhorn“-Ressourcen zu suchen, die alles abdecken können und bezahlbar bleiben.

Advanced Analytics-Projekte haben einen genau definierbaren Skill-Bedarf. Unabhängig von der Jobbezeichnung oder dem Titel, kann bereits bei der Projektplanung der Skill-Bedarf (bis auf die Timeline- Ebene) geplant werden. Hierdurch wird die richtige Mischung an Skills aus einem Pool von Ressourcen möglichst effizient zusammengestellt.

Skillliste Projekt Effizienz Advanced Analytics

LEARNING 2 - WIEDERVERWENDUNG VON CODE UND INFRASTRUKTUR

Wiederverwendbarkeit und Modularität sind Konzepte, welche in der klassischen IT gang und gäbe sind. Wir versuchen spätere, größere Umbauten und Erweiterungen, durch einen möglichst modularen Aufbau von Komponenten und Software, mit einer gering höheren Investition bei der Entwicklung der Plattformen, so einfach wie möglich, zu machen.

In klassischen BI-Bereichen (z. B. Reporting Templates), im Plattformaufbau (z. B. Infrastructure as a service) und in der Softwareentwicklung (z. B. Design Patterns) sind solche Konzepte bereits stark etabliert. Im Bereich Advanced Analytics bisher noch nicht. Auch Advanced Analytics-Entwickler nutzen zwar modular aufgebaute Bibliotheken (Scikit, Pandas etc.), setzen aber seltener auf entsprechende Konzepte in ihren eigenen Applikationen.

Am Ende des Tages sind viele Advanced Analytics-Produkte auch Softwareprodukte. Im vergangenen Jahr haben wir feststellen können, dass wir durch den Aufbau entsprechender eigener Bibliotheken, wie dem INFOMOTION Data Lab Framework, Wiederverwendbarkeit und eine modulare Denkweise auch in Advanced Analytics-Produkte integrieren konnten.

LEARNING 3 - WIRTSCHAFTLICHKEIT IM FOKUS - DAS ABWÄGEN VON WISSENSCHAFT VS. WIRTSCHAFT

Der erste Schritt vieler Advanced Analytics-Projekte ist die sogenannte Machbarkeitsstudie. Im Labor wird zunächst verprobt, ob es sich bei einem geplanten Vorhaben um ein statistisch machbares und wirtschaftliches Projekt handelt. Während einer solchen Studie befindet man sich stetig im Konflikt mit diesen Punkten.

Das „Science“ in Data Science bedeutet, dass geforscht wird: und zwar immer weiter nach einer Möglichkeit, ein bestimmtes Projektvorhaben unter z. B. der Zugabe von weiteren (externen) Daten möglich zu machen. Wie in der Forschung üblich, kann es hierbei schwierig sein, einen konkreten Zeitpunkt oder einen Meilenstein festzulegen, an dem besagte statistische Machbarkeit nachgewiesen bzw. ein Modell mit produktionswürdiger Güte gebaut werden kann.

Stakeholder werden mit der Zeit ungeduldig. Mit jedem Tag oder jeder Woche, die weiter geforscht wird, steigt das Risiko, eine scheiternde Investition zu tätigen. Wie von Projektleitern gewohnt, werden Zeitplanungen und Meilensteine erwartet, die ein festes, möglichst unumstößliches Ziel haben. Doch das steht im direkten Konflikt mit der statistischen Unschärfe, die eine solche Aussage unrealistisch macht.

In der Praxis haben wir gelernt mit verschiedenen Konzepten und Methoden diesem Konflikt zu begegnen. Durch einen „Fail Fast“-Entwicklungsansatz stellen wir sicher, möglichst schnell zu einer Aussage zu kommen. In Projekten verfolgen wir eine Mischung aus MVP (Minimum Viable Product) Entwicklung und Refactoring-Ansatz: Wir möchten so schnell wie möglich zur ersten lauffähigen Lösung kommen und diese durch Refactoring verbessern. Timeboxing der Machbarkeitsstudie (unter Einbezug eines entsprechenden Puffers für etwaige Verzögerungen) ermöglicht es, zu einem definierten Zeitpunkt die Reißleine zu ziehen. Das Ergebnis einer Machbarkeitsstudie und somit auch die wesentlichen Bestandteile des Ergebnisses eines INFOMOTION Data Design Sprints, kann in dem Moment beispielsweise sein, die gesammelten Erkenntnisse zu dokumentieren sowie Empfehlungen zum weiteren Vorgehen und einem Prototypen zu formulieren.

EFFIZIENZ STEIGERUNG DURCH ERFAHRUNG UND ALTBEKANNTE METHODEN & FORMATE

In über 17 Jahren haben wir bei INFOMOTION unzählige Formate, Methoden und Vorgehensmodelle   getestet und entwickelt, um Projekte möglichst effizient zu gestalten und den größtmöglichen Mehrwert für unsere Kunden zu heben. Um aus den Daten die größte Performance rauszuholen, beschäftigt sich INFOMOTION mit den Fragen: Wie kann die Effizienz in Advanced Analytics-Projekten gesteigert werden? Was sind die Learnings? Wie kann im Unternehmen Data Performance gesteigert werden?

Weiterführende Informationen

Autor

Philipp Paraguya

Manager

Philipp Paraguya hat angewandte Mathematik und Informatik studiert und arbeitet seit dem Studium als BI und Advanced Analytics-Berater in verschiedenen Branchen und Projekten. Durch seinen Hintergrund als Softwareentwickler hat er einen starken Bezug zum klassischen Software-Engineering und dem sinnvollen Einsatz von Data ScienceLösungen. Aktuell ist er bei INFOMOTION als Manager für ein Team von Advanced Analytics Consultants verantwortlich, welche Kunden von der Orientierung über Lab und Industrialisierungsprodukte bis in den Betrieb begleiten.

E-Mail senden