Precisa de computação em nuvem? Comece agora mesmo

Como o TrafficPeak ajudou a proporcionar uma experiência superior para assistir ao futebol americano

Nathan Hoffmann

escrito por

Nathan Hoffmann

June 28, 2024

Nathan Hoffmann

escrito por

Nathan Hoffmann

Nathan Hoffmann tem mais de 20 anos de experiência em projeto e otimização de fluxos de trabalho de streaming de mídia e comércio eletrônico. Como arquiteto corporativo da Akamai, Nathan traz ampla experiência técnica em avaliações de arquitetura para criar roteiros de otimização saudáveis, identificar riscos e lacunas na resiliência e alinhar projetos às metas de negócios do cliente e ao ROI. Antes de ingressar na Akamai, Nathan ocupou vários cargos de arquiteto de nuvem na Walt Disney Studios e na National Football League.

O TrafficPeak nos dá visibilidade em tempo real dos dados dos nossos clientes de mídia, que usamos para equilibrar o tráfego entre as regiões geográficas.
O TrafficPeak nos dá visibilidade em tempo real dos dados dos nossos clientes de mídia, que usamos para equilibrar o tráfego entre as regiões geográficas.

Em um dia de grande jogo, a solução de problemas e possíveis incidentes em tempo real é fundamental para garantir que o evento seja bem-sucedido. O TrafficPeak nos dá visibilidade em tempo real dos dados dos nossos clientes de mídia, que usamos para equilibrar o tráfego entre as regiões geográficas e superar as expectativas dos espectadores em relação a uma experiência tranquila e confiável.

Desafio comercial

Na Akamai, os grandes eventos esportivos, especialmente o maior jogo de futebol americano do ano, são alguns dos eventos mais importantes do ano. As maiores empresas de mídia usam nossas soluções para transmitir o jogo aos espectadores em todo o mundo. No entanto, para garantir que cada espectador aproveite o jogo sem enfrentar problemas com armazenamento em buffer e interrupções, precisamos coletar dados detalhados em tempo real.

A final de futebol americano deste ano foi maior do que nunca. Com uma média de quase 124 milhões de espectadores, esse foi o evento de transmissão ao vivo mais assistido desde o pouso da Apollo 11 na Lua. As empresas de streaming de mídia e as emissoras estão entre os maiores clientes da Akamai, o que significa que garantir que elas brilhassem durante o evento era nossa principal prioridade.

A necessidade de mitigar rapidamente os problemas de desempenho

Para um provedor de mídia, nossa equipe na Akamai precisava consultar os logs da CDN (Rede de Entrega de Conteúdo), o que exigia a recuperação de dados em segundos. Infelizmente, para nós, a coleta e a análise dos dados do DataStream 2 e do CMCD estavam levando 20 minutos nos volumes de tráfego de pico. Para o grande jogo e qualquer outro evento ao vivo, 20 minutos é tempo demais.

Para mitigar os problemas de desempenho e segurança rapidamente, antes que os espectadores sentissem o impacto, precisávamos de insights de dados em tempo real. Precisávamos coletar, analisar e visualizar dados, como região geográfica, cidade, estado, número do sistema autônomo (ASN) e detalhes do servidor, em tempo real e em uma única exibição para localizar e corrigir erros com mais facilidade. 

Se pudéssemos ver instantaneamente quais problemas eram exclusivos de um provedor e quais estavam espalhados pelas redes ASN, poderíamos tomar decisões de mitigação com rapidez, como mover o tráfego para regiões diferentes para contornar os trânsitos afetados.

Para a análise pós-jogo, também queríamos analisar as exceções de desempenho e ver suas origens. Dessa forma, poderíamos ter uma visão clara de seu impacto e tomar decisões de mitigação orientadas por dados no futuro.

O grande jogo

Como o TrafficPeak é o nosso serviço de observabilidade gerenciado pela Akamai com tecnologia da Hydrolix, não foi difícil tomar a decisão de usá-lo no grande jogo. O serviço é fácil de implantar, mesmo com personalização.

Criamos uma visualização dos principais ASNs, códigos de resposta e erros. Examinamos as métricas de desempenho de entrega e pudemos identificar a degradação em determinadas regiões. Por exemplo, foi fácil filtrar por cidade para verificar se o desempenho estava adequado ou se existiam valores atípicos, e então aplicar correções antes que os espectadores fossem impactados.

Para nós, o TrafficPeak forneceu o maior valor em três áreas: facilidade de personalização, dados em tempo real e arquitetura.

Facilidade de personalização

Por ser uma pessoa técnica, escrever consultas complexas é fácil para mim. Mesmo assim, com o TrafficPeak, a capacidade de personalizar qualquer insight de dados em painéis personalizados é um recurso incrível e impressionante.

Dados em tempo real

Embora existam soluções semelhantes, como a ELK Stack, para ingestão, processamento e visualização de dados, elas não são tão rápidas quanto o TrafficPeak. No horário de pico do tráfego, coletávamos quase 11 milhões de registros por segundo, e a divisão e a consulta dos dados levavam segundos. É difícil replicar essa velocidade com outras ferramentas.

Arquitetura

O TrafficPeak foi projetado para estar dentro do Kubernetes. Como usuário do Kubernetes, sei como dimensionar e distribuir o serviço. Seu design é ideal para implementações na nuvem. Está claro que o design do software e a arquitetura de back-end foram muito bem pensados.

Os resultados

Coletamos 53 bilhões de registros e transformamos 41 terabytes de dados brutos em 5,76 terabytes de dados compactados armazenados.

O grande jogo foi um evento de sucesso. Coletamos 53 bilhões de registros e transformamos 41 terabytes de dados brutos em 5,76 terabytes de dados compactados armazenados. Tivemos um baixo número de erros, o que atribuo ao fato de o TrafficPeak fornecer visibilidade em tempo real dos erros à medida que ocorriam, para que pudéssemos melhorá-los instantaneamente.

Além disso, obter visibilidade de todos os nossos dados foi muito útil. Em geral, com eventos ao vivo, é difícil ver e entender o que está acontecendo em tempo real. Nossos clientes de mídia precisam de métricas, como a taxa de bits média, para que possam garantir que a maioria dos usuários esteja no topo da escala de renderização. O TrafficPeak nos forneceu essas métricas para que pudéssemos mitigá-las em tempo real.

Após o evento, usamos o TrafficPeak para investigar os problemas de desempenho ocorridos. Os resultados mostraram áreas em que podemos fazer melhorias na próxima vez, como reescrever filtros para identificar melhor problemas semelhantes. Agora sabemos como criar os filtros certos para eventos futuros, para que esses mesmos problemas não voltem a acontecer.

Aproveite os benefícios

Use o TrafficPeak para descobrir e resolver problemas de desempenho e segurança com antecedência. Proteja a confiança e a atratividade da sua marca, aumentando os seus resultados.



Nathan Hoffmann

escrito por

Nathan Hoffmann

June 28, 2024

Nathan Hoffmann

escrito por

Nathan Hoffmann

Nathan Hoffmann tem mais de 20 anos de experiência em projeto e otimização de fluxos de trabalho de streaming de mídia e comércio eletrônico. Como arquiteto corporativo da Akamai, Nathan traz ampla experiência técnica em avaliações de arquitetura para criar roteiros de otimização saudáveis, identificar riscos e lacunas na resiliência e alinhar projetos às metas de negócios do cliente e ao ROI. Antes de ingressar na Akamai, Nathan ocupou vários cargos de arquiteto de nuvem na Walt Disney Studios e na National Football League.