©2024 Akamai Technologies
DataStream war das fehlende Puzzleteil für unsere DevOps-Flexibilität, das wir für schnelle E-Commerce-Entwicklungsgeschäfte wie das unsere dringend benötigten.
Technologiespezialist, E‑Commerce‑IT, Douglas
Angestrebter Ausbau des Onlinegeschäfts
Douglas wurde 1821 gegründet und ist als führender Anbieter von Schönheits- und Kosmetikprodukten auf dem europäischen Einzelhandelsmarkt in 24 Ländern vertreten. Über 2.400 Ladengeschäfte, einen Onlineshop und eine App bietet Douglas mehr als 50.000 Produkte an.
In den letzten Jahren sah sich dieser milliardenschwere Einzelhändler mit einem wachsenden Wettbewerb durch exklusive Kosmetikketten und die günstige Preisgestaltung von Discountern, Drogeriegeschäften und Onlinehändlern konfrontiert. Wie viele andere Einzelhändler verzeichnete auch Douglas aufgrund der hohen Betriebskosten seiner Ladengeschäfte Preisrückgänge und einen zunehmenden Margendruck. Ein großes Problem sind die exorbitanten Mieten und die Kosten für das Ladenpersonal, was bei rückläufigen Verkäufen schnell zu einem Problem werden kann. Daher wurde es für Douglas zu einer strategischen Notwendigkeit, seine Onlineumsätze zu steigern.
Ausfallzeiten sind teuer
Angesichts des wachsenden Onlinegeschäfts musste Douglas mehrmals täglich neuen Code und neue Konfigurationen übertragen. Doch bei hoher Geschwindigkeit kommt es häufiger zu Fehlern. In einem Fall verursachte eine Codeveröffentlichung mehrere fehlerhafte interne Links, was für Websitebesucher und Suchmaschinen-Crawler zum HTTP-Fehler 404 führte.
Leider dauerte es einige Zeit, bis das Technikteam dies entdeckte, da die Daten nicht in Echtzeit verfügbar waren. Solche Ausfallzeiten sind sowohl aus Umsatz- als auch aus Markenperspektive teuer, da sie sich negativ auf die SEO und die Sichtbarkeit in Suchmaschinen auswirken.
Die DevOps-Teams verwenden Tools zum Überwachen der Anwendungsperformance (Application Performance Monitoring, APM) für die verteilte Anwendungsverfolgung sowie Kundenanalysetools für die Überwachung der Browseraktivität und des Traffics von Endnutzern. Diese Daten sind jedoch entweder auf geschäftliche Einblicke ausgerichtet oder durch selektive Seiteninstrumentierung mit JS-Tags eingeschränkt. Die DevOps-Teams mussten in HTTP-Protokollen noch eine Ebene tiefer gehen, um Fehler schneller zu erkennen, zu verfolgen und zu beheben. Außerdem benötigten sie Echtzeiteinblicke in alle Schichten ihres Technologiestacks, einschließlich der CDN-gestützten Middle Mile.
Unternehmen wie Douglas müssen in Echtzeit wissen, was an den Edges ihrer Netzwerke passiert, und diese Informationen mit integrierten Protokollfeeds aus anderen Schichten des Stacks in einer ganzheitlichen Ansicht zur Überwachung des Systemzustands zusammenfassen. Diese Transparenz und Kontrolle wird immer wichtiger, wenn Unternehmen ihre Content- und Anwendungslogik von den überlasteten Ursprungsservern zunehmend an die Edge verlagern.
Echtzeiteinblicke erreichen
Mit DataStream von Akamai konnten die DevOps-Teams von Douglas Fehler schnell nachverfolgen und beheben. Genauer gesagt erhielten sie Programmzugriff auf Echtzeit-Protokolldaten, was eine hohe Geschwindigkeit sowie optimierte Entwicklung und betriebliche Workflows unterstützte. Neben einer schnelleren Erkennung und kürzeren durchschnittlichen Wiederherstellungszeit bildet dies die Grundlage für das agile DevOps-Modell, das Douglas nun schrittweise implementiert.
Kontinuierliche Überwachung
Mithilfe von Push-APIs kann Douglas in einer kostengünstigen, skalierbaren, serverlosen Architektur arbeiten, sodass Server keine APIs für Daten mehr abfragen müssen. Die Protokollerfassung wird automatisch und regelmäßig ausgeführt, wobei DataStream sechs rohe Protokollstreams durch die Verarbeitungspipeline in die entsprechenden Cloudspeicher-Buckets leitet. Gleichzeitig kann Douglas über entsprechende Befehle Datenströme einzeln ein- oder ausschalten. Sobald die Protokolle vorverarbeitet und HTTP-Statuscodes auf den Ebenen 300, 400 und 500 aggregiert wurden, bleiben Betreiber dauerhaft über Anomalien informiert.
Vor und nach der Überwachung
Das Risiko von fehlerhaftem Code ist nach einer neuen Bereitstellung besonders hoch. Die aggregierten Protokolle von DataStream oder Analysesystemen von Drittanbietern wie Kinesis werden an Dashboarding- und Alerting-Tools wie CloudWatch, Athena oder Grafana weitergeleitet. Wenn die aggregierten Metriken ungewöhnliche Fehlermuster aufweisen oder Warnmeldungen zu Anomalien auslösen, z. B. bei einer hohen Fehleranzahl oberhalb des vordefinierten Schwellenwerts, werden Betreiber nahezu in Echtzeit informiert. Sie können dann Rohprotokolle abrufen, um die Ursache zu ermitteln, und Daten aus anderen Schichten des Stacks für den Zeitraum vor der Anomalie zuordnen. Außerdem ist es möglich, Anomalien zu bewerten und Muster zu erkennen. Sowohl die rohen als auch die aggregierten Protokolle werden in kurzfristigen Datenpuffern sowie im Langzeitspeicher für Verlaufsanalysen gespeichert.
Funktionsübergreifende Einblicke
Douglas betreibt eine eigene Analyse-Engine, die eine detaillierte und nutzerdefinierte Downstream-Aggregation ermöglicht, indem nützliche Qualifier an Protokolle angehängt werden (URL-Muster-ID oder User Agents). Da diese Qualifier die Protokolle nach Seitengruppen kategorisieren (z. B. Produkt-, Such- oder Kategorieseite), können die Protokolle an die jeweiligen Code-Eigentümer in den Entwicklungsteams weitergeleitet werden und ermöglichen die Bereitstellung sinnvoller Warnmeldungen an die richtigen Personen. Damit profitieren sowohl die Entwicklungs- als auch die Technikteams von Einblicken nahezu in Echtzeit und gesteigerter DevOps-Agilität.
End-to-End-Transparenz
Derzeit prüft Douglas, wie die Daten aus DataStream mit APM- und Kundenanalysesystemen verknüpft und korreliert werden können. Dadurch könnten die Teams die Browseraktivität eines Websitebesuchers mit der Reaktion des Backend-Systems in Zusammenhang bringen. In diesem Fall zeigt DataStream an, was aus dem Cache bereitgestellt wurde, sowie die Latenzen zwischen Ursprung, Edge und Endnutzer. Mit diesem Einblick kann das Technikteam Fehler schnell und effizient beheben und die CDN-Performance optimieren, um maximalen geschäftlichen Nutzen zu erzielen.
„Jetzt können sowohl unsere Entwicklungs- als auch unsere Technikteams Fehler nahezu in Echtzeit erkennen, schnell handeln und rasch Abhilfe schaffen. So werden Ausfallzeiten minimiert“, fasst ein IT-Technologiespezialist für den Onlinehandel von Douglas zusammen.
Über Douglas
Mit rund 2.400 Geschäften und immer mehr Onlineshops in 24 europäischen Ländern ist Douglas Europas führender Anbieter von hochwertigen Schönheitsprodukten. Im Geschäftsjahr 2017/2018 erwirtschaftete das Unternehmen einen Umsatz von 3,3 Milliarden Euro. Rund 20.000 Douglas Beauty Advisors sind täglich darauf bedacht, ihre Kunden schöner und damit zufriedener zu machen. Douglas bietet rund 50.000 hochwertige Produkte von mehr als 650 Marken in den Bereichen Parfümerie, dekorative Kosmetik und Hautpflege sowie Nahrungsergänzungsmittel und Accessoires an. Mit rund 40 Millionen Inhabern einer Beauty Card betreibt Douglas eines der größten Kundentreueprogramme in Europa. Dank seiner hervorragenden Beratung und einzigartigen Services ist Douglas eine der besten Adressen für Schönheit – sowohl im Fachgeschäft als auch online.