22. Mai 2020
Teilen über

Wie viel wird die Pandemie mein Unternehmen kosten?

Jede Unternehmensorganisation muss ständig auf Veränderungen in ihrem Betriebsumfeld reagieren. Messen Sie die Veränderung, prognostizieren Sie die Auswirkungen auf Sie und passen Sie sich an – so einfach ist das. In der Praxis kann es eine Herausforderung sein, in einer neuen Situation die richtigen Dinge zu messen, egal wie datengetrieben Sie sind, und oft werden neue Datenquellen und Ansätze benötigt. Das Sammeln von Daten aus internen und externen Quellen, das Erstellen von Dashboards zur Entscheidungsunterstützung und von Modellen für maschinelles Lernen mit benutzerdefinierten Benutzeroberflächen kann für ein großes Datenteam eine mehrmonatige Aufgabe sein! Wenn die Veränderung plötzlich eintritt, müssen Sie schnell reagieren – aber wenndie Auswirkungen ungewiss sind, kann der Start eines groß angelegten Entwicklungsprojekts eine teure Überreaktion sein. In diesem Beitrag haben wir ein schnelles Daten-App-Prototyping-Tool, Streamlit, angewendet, um Szenarien für Umsatzauswirkungen in der "neuen Normalität" zu untersuchen.

Die Kosten von COVID-19

Für COVID-19 gibt es eine Reihe von Dashboards, mit denen jeder Aspekt der Pandemie überwacht werden kann. Bei der berühmtesten, die an der Johns Hopkins University entwickelt wurde, war es besonders beeindruckend, wie schnell die Macher in der Lage waren, alle Datenquellen zu finden und zu aggregieren, als das Virus begann, das öffentliche Interesse zu wecken (sie waren Profis, bevor es cool war). Ein globales Dashboard ist jedoch für die meisten Unternehmen kaum umsetzbar. Wie gewinnen wir aus dieser Fülle an Daten relevante Erkenntnisse beispielsweise für einen großen europäischen Einzelhändler?

Streamlit
Basierend auf der "neuen Normalität", die durch die Mobilitätsdaten des Einzelhandels angezeigt wird, und angesichts der aktuellen COVID-19-Falldaten, der epidemiologischen SEIR-Simulation und der aktuellen Verkaufsdaten kann unser Beispielhändler in den Jahren 2020Q2-Q3 mit einem Defizit von etwa 35 % bei den stationären Verkäufen und einem Überschuss der E-Commerce-Umsätze aufgrund der Pandemie auf dem finnischen Markt rechnen.

Die öffentlich zugänglichen, qualitativ hochwertigen Daten, die für das oben genannte Dashboard gesammelt wurden, scheinen auch für diesen Zweck ein guter Ausgangspunkt zu sein. Wir könnten auch regionale Mobilitätstrends nutzen, z.B. von Google (vorerst verfügbar), um das aktuelle Konsumentenverhalten besser zu verstehen. Es wäre schön, die interessanten Teile der Daten zusammen mit einigen internen Unternehmensdaten zu präsentieren, also sollten wir vielleicht Data-Warehouse-Pipelines aufbauen und bestehende Vertriebs-Dashboards ändern oder neue erstellen. und pP Vielleichtmöchten wir auch, dass unsere Datenwissenschaftler Modelle für maschinelles Lernen erforschen und erstellen, um schwierige Entscheidungen zu unterstützen und einfache Entscheidungen mit diesen aktuellen Daten zu automatisieren. Wenn Sie es sich noch einmal überlegen, schauen Sie sich vielleicht einfach woanders um, warten Sie die Pandemie ab und hoffen Sie, dass das Unternehmen immer noch steht, nachdem sich der Staub gelegt hat? Mit Streamlit können Sie all dies liefern, bevor Sie sich zu einer größeren Investition verpflichten müssen – keine Renditeberechnungen erforderlich.

Hier kommt Streamlit ins Spiel – Tool für den Python-Datenspezialisten

steamlit.io wurde vor einigen Monaten veröffentlicht und ist ein Open-Source-App-Framework zum Erstellen einer Ad-hoc-Fast-Data-App "in Stunden, nicht Wochen". Streamlit verwandelt im Wesentlichen ein Python-Skript in eine responsive Web-App, von der man denken könnte, dass sie mit einem modernen Front-End-Framework maßgeschneidert wurde, und das alles mit sehr wenig zusätzlichem Aufwand. Um ein interaktives Front-End-Widget zum Steuern einer Variablen zu erstellen, schließen Sie es einfach in einen Streamlit-Aufruf ein. Um das Ergebnis einer Datenpipeline oder einer teuren Berechnung zwischenzuspeichern, wird nur ein Streamlit-Dekorator benötigt. Erweitertes Caching und Hot Reload machen Streamlit-Skripting so schnell und süchtig machend wie die Front-End-Entwicklung, selbst bei der Arbeit mit ziemlich komplexen Daten-Apps. Wenn Sie eine interaktive Schnittstelle anstelle einer API benötigen, reicht ein Notebook nicht ganz aus, aber eine benutzerdefinierte Full-Stack-Web-App wäre zu viel, Streamlit könnte genau das sein, was Sie brauchen. Zu den attraktiven Anwendungsfällen gehören interaktive Datenerkundungen, schnelles Prototyping von Apps für maschinelles Lernen und Was-wäre-wenn-Tools, um die Iteration zwischen Geschäftsbeteiligten und Datenentwicklern zu reduzieren.

Um die Auswirkungen von COVID-19 auf den Umsatz zu modellieren, können wir auf den Zug der Bürgerepidemiologen aufspringen und ein einfaches Modell implementieren, um die anfälligen, exponierten, infizierten und genesenen (SEIR) Fraktionen der Bevölkerung in der Region von Interesse zu simulieren. Mit den verfügbaren Daten zu den tatsächlich bestätigten Fällen können wir das aktuelle Datum in Form von Simulationstagen annähern und gleichzeitig die Dauer und das Ausmaß der sozialen Distanzierung (reduzierte Krankheitsübertragung) anpassen, wenn dies angesichts der aktuellen Notfallmaßnahmen der lokalen Regierung angemessen ist. Anhand regionaler Mobilitätstrends können wir den Rückgang der Einzelhandelsaktivitäten der Verbraucher abschätzen und den Zeitrahmen unseres anomalen Ereignisses (mit fallspezifischen Start-/Enddefinitionen) entsprechend anpassen. Schließlich können wir ein Zeitreihenmodell an unsere Verkaufsdaten vor der Pandemie anpassen und die Auswirkungen auf den Umsatz für die erwartete Dauer des Ereignisses abschätzen, z. B. getrennt für Einzelhandelsgeschäfte und E-Commerce. Hier haben wir Prophet verwendet, um z.B. Saisonalitäten und nationale Feiertage leicht zu modellieren, aber in einfachen Fällen konnten vernünftige Schätzungen erzielt werden, indem nur lineare Trends und konstante Intervalle betrachtet wurden. Mit einem einzigen reinen Python-Skript erhalten wir am Ende die geschätzten Umsatzauswirkungen für vom Benutzer auswählbare Region of Interest, anpassbare Social-Distancing-Effekte und eine ansprechende Empfindlichkeit der Browser-Benutzeroberfläche aufgrund zwischengespeicherter Datenpipelines und Berechnungen – und das alles in einem Arbeitstag, ohne unsere vielbeschäftigten Frontend-Profis zu stören.

Fazit zu einer schnellen Daten-App

Der obige Auswirkungsrechner kratzt kaum an der Oberfläche von Streamlit, das auch nahtlos mit Deep-Learning-Modellen zusammenarbeitet. Um Ihre gelangweilte Familie zu Hause zu unterhalten, fügen Sie beispielsweise etwa 30 Zeilen Streamlit-Code zu einem neuronalen Übertragungsskript hinzu , um es auf magische Weise in eine Web-App auf Ihrem ungenutzten Gaming-PC zu verwandeln , die ein Kind mit einem Telefon verwenden kann, um Familienfotos so aussehen zu lassen, als wären sie von Renaissance-Meistern gemalt worden. Es gibt verschiedene Tutorials und Demos, um mit Streamlit zu beginnen, einer unserer Favoriten ist der nette GAN-Gesichtsgenerator, der jetzt auch auf "The Kraken" in unserem Büro läuft, um hoffentlich den einen oder anderen Quarantäne-Ausbrecher aufzumuntern. Wenn Sie Docker bevorzugen, können Sie stattdessen unser Image mit docker run –gpus all -p 8501:8501 ahtonen/demo_face_gan:latest ausprobieren.

Schnelle Daten-App
Diese Bürokollegen gibt es nicht. Beitragsfoto von Ryan Stone.

Diese Bürokollegen gibt es nicht.

Geschrieben von Juho Kerttula. Juho ist Senior Data Scientist bei DAIN Studios, mit Sitz in Helsinki.

Referenzen & mehr

#Gettingstartedwith ist DAIN Studios' neue Blog-Serie für diejenigen unter Ihnen, die sich mit Daten und KI vertraut machen möchten.

Neugier ist unser Kern, und viele DAINianer experimentieren ständig mit Dingen. Wir sind es unseren Kunden schuldig, über neue Technologien auf dem Laufenden zu bleiben, und um ehrlich zu sein, da wir ein bisschen auf der nerdigen Seite sind, ist das ganz natürlich! Sich Zeit zum Lernen zu nehmen, ist auch etwas, das wir als Arbeitgeber fördern wollen, und stellen sicher, dass jede Woche etwas Zeit für den Wissensaustausch mit Kollegen reserviert ist.
Die Blogs und Beiträge, die wir mit dem #gettingstartedwith-Tag veröffentlichen, sind eher eine Einführungsebene für diejenigen unter Ihnen, die sich mit der Welt der Daten und der KI vertraut machen möchten. Dabei kann es sich um Tipps und Tricks handeln, die zeigen, wie man eine API in 60 Minuten erstellt, oder um ein lustiges Projekt zum Experimentieren mit Textanalyse. Oder wir teilen Links zu gutem Lesen oder Ansehen, verfügbarem E-Learning oder Leuten, denen man folgen kann.

Einzelheiten

Titel: Schnelle Daten-Apps mit Streamlit – Case: Wie viel wird die Pandemie mein Unternehmen kosten?
Autor:
DAIN StudiosDaten & KI Strategieberatung
Veröffentlicht in ,
Themen:
Aktualisiert am 3. August 2022