Monitoramento de DevOps

Aumente a visibilidade durante cada estágio do pipeline de entrega

Teste o Compass grátis

Aprimore a experiência de desenvolvedor, catalogue todos os serviços e melhore a integridade do software.

Com o DevOps, a expectativa é desenvolver mais rápido, testar com regularidade e lançar com mais frequência, além de melhorar a qualidade e reduzir os custos. Para ajudar a alcançar esse resultado, as ferramentas de monitoramento de DevOps proporcionam automação, medição e visibilidade expandidas durante todo o ciclo de vida do desenvolvimento – de planejamento, desenvolvimento, integração e teste até a implementação e as operações.

O ciclo de vida do desenvolvimento de software moderno está mais rápido do que nunca, com vários estágios de desenvolvimento e de testes acontecendo ao mesmo tempo. Essa mudança gerou o DevOps, uma mudança das equipes isoladas que executam funções de desenvolvimento, teste e operações para uma equipe unificada que desempenha todas as funções e adota o princípio “you build it, you run it” (YBIYRI).

Com mudanças frequentes de código agora sendo algo comum, as equipes de desenvolvimento precisam do monitoramento de DevOps, que proporciona uma visão abrangente e em tempo real do ambiente de produção.

O que é monitoramento de DevOps?

Diagrama de monitoramento versus observabilidade

O monitoramento de DevOps envolve a supervisão de todo o processo de desenvolvimento, desde planejamento, desenvolvimento, integração e teste até implementação e operações. Ele envolve uma visão completa e em tempo real do status de aplicativos, serviços e infraestrutura no ambiente de produção. Funções como streaming em tempo real, repetição histórica e visualizações são componentes fundamentais do monitoramento de aplicativos e serviços.

O monitoramento de DevOps permite que as equipes respondam a qualquer degradação na experiência do cliente, de maneira rápida e automática. E, o mais importante, ele permite que as equipes façam o “shift left” para estágios anteriores do desenvolvimento e minimizem mudanças de produção interrompidas. Um exemplo é a melhor instrumentação de software para detectar e responder a erros, manualmente por plantão e automaticamente sempre que possível.

Monitoramento de DevOps versus observabilidade

Quando você considera o lado esquerdo do símbolo do infinito como o lado do produto e o lado direito como o lado da operação, o gerente de produto que insere uma nova função na produção está interessado em ver como o projeto se divide em tarefas e histórias de usuários. O desenvolvedor do lado esquerdo do projeto precisa ver como mover função para a produção, incluindo tickets de projeto, histórias de usuários e dependências. Se os desenvolvedores seguirem o princípio do DevOps de “you build it, you run it”, eles também estarão interessados na correção de incidentes.

Passando para o lado das operações do ciclo de vida, o engenheiro de confiabilidade do site precisa entender os serviços que podem ser medidos e monitorados, de modo que, se houver um problema, ele possa ser corrigido. Se você não tiver uma cadeia de ferramentas de DevOps que una todos esses processos, vai acabar com um ambiente confuso, não correlacionado e caótico. Se você tiver uma cadeia de ferramentas bem integrada, vai poder ter um contexto melhor do que está acontecendo.

A importância do monitoramento de DevOps

Uma abordagem de DevOps amplia o monitoramento contínuo para os ambientes de staging, testes e até desenvolvimento. Existem diversos motivos para isso.

Mudanças frequentes de código exigem visibilidade

As mudanças de código frequentes impulsionadas pela integração e implementação contínuas aceleraram o ritmo das mudanças e tornaram os ambientes de produção cada vez mais complexos. Com microsserviços e micro front-ends entrando em ambientes nativos de nuvem modernos, há centenas e, às vezes, milhares de cargas de trabalho diferentes operando na produção, cada uma com requisitos operacionais de escala, latência, redundância e segurança diferentes.

Assim, a necessidade de maior visibilidade foi impulsionada. As equipes não só precisam detectar e responder a uma degradação da experiência do cliente, mas fazer isso em tempo hábil.

Colaboração automática

O DevOps exige, de maneira implícita, a liberação de uma maior colaboração entre o desenvolvimento, as operações e as funções empresariais nas equipes. No entanto, a colaboração pode ser bloqueada pela falta de integração entre as ferramentas, o que resulta em desafios de coordenação com equipes diferentes, um dos principais resultados da pesquisa sobre DevOps da Atlassian.

Você pode automatizar a colaboração com práticas como obter uma visão completa do pipeline de desenvolvimento dentro do editor. Além disso, defina regras de automação que detectem commits ou pull requests. Depois, atualize o status dos itens relacionados do Jira e envie mensagens para o canal Slack da equipe. Aproveite, ainda, os insights que originam relatórios de varredura, testes e análises.

Captura de tela de colaboração automática

Experimentação

A necessidade de otimizar produtos para responder às necessidades do cliente, orientada pela personalização e por funis de conversão otimizados, gera uma experimentação constante. Os ambientes de produção podem executar centenas de experimentos e sinalizadores de funcionalidade, o que dificulta a comunicação da causa de degradação da experiência por parte dos sistemas de monitoramento.

A exigência cada vez maior de serviços e aplicativos sempre ativos, além dos compromissos rigorosos de SLA, pode adicionar vulnerabilidades aos aplicativos. As equipes de desenvolvimento precisam garantir a definição de objetivos de nível de serviço (SLOs) e indicadores de nível de serviço (SLIs) que sejam monitorados e permitam ações futuras.

Gerenciamento de alterações

Como a maioria das interrupções de produção é causada por mudanças, o gerenciamento de mudanças é essencial, sobretudo para aplicativos críticos, como os dos setores financeiro e de saúde. Os riscos associados às mudanças precisam ser determinados, e os fluxos de aprovação devem ser automatizados com base no risco da alteração.

Lidar com essas complexidades requer uma estratégia abrangente de compreensão e monitoramento. Isso envolve a definição e a adoção de práticas de monitoramento, além de um conjunto de ferramentas de monitoramento ricas, flexíveis e avançadas, essenciais para os processos de desenvolvimento.

Monitoramento dependente do sistema

Os sistemas distribuídos ficaram mais comuns e em geral são compostos por muitos serviços menores em toda a organização. Agora, as equipes não precisam apenas monitorar os sistemas que criam, mas também monitorar e gerenciar o desempenho e a disponibilidade dos sistemas dependentes. A Amazon Web Services (AWS) oferece mais de 175 produtos e serviços, incluindo ferramentas de desenvolvedor, computação, armazenamento, rede, banco de dados, análises, implementação, gerenciamento e dispositivos móveis. Se você criar um aplicativo na AWS, precisará ter a certeza de que escolheu o serviço certo para as necessidades do aplicativo. Também é preciso ter instrumentação e estratégias para rastrear erros de maneira distribuída e lidar com falhas de sistemas dependentes.

Principais recursos do monitoramento de DevOps

De acordo com a tradição do DevOps, o desenvolvimento e a implementação de uma estratégia de monitoramento também exigem atenção às práticas essenciais e um conjunto de ferramentas.

Teste de "shift-left"

O teste de "shift-left", realizado no início do ciclo de vida, ajuda a aumentar a qualidade, encurtar os ciclos de teste e reduzir erros. Para as equipes de DevOps, é importante estender as práticas de teste de "shift-left" para monitorar a integridade dos ambientes de pré-produção. Isso garante que o monitoramento seja implementado de maneira antecipada e com frequência, a fim de manter a continuidade durante a produção e a preservação da qualidade dos alertas de monitoramento. O teste e o monitoramento devem atuar juntos, com o monitoramento antecipado ajudando a avaliar o comportamento do aplicativo por meio de jornadas e transações importantes do usuário. O processo também ajuda a identificar desvios de desempenho e disponibilidade antes da implementação da produção.

Gerenciamento de alertas e incidentes

Em um mundo nativo da nuvem, os incidentes são tão reais quanto bugs no código. Esses incidentes incluem falhas de hardware e rede, configuração incorreta, exaustão de recursos, inconsistências de dados e bugs de software. As equipes de DevOps devem aceitar os incidentes e ter monitores de alta qualidade disponíveis para responder a eles.

Entre as práticas recomendadas para ajudar nesse processo estão:

Crie a cultura de colaboração, em que o monitoramento é usado durante o desenvolvimento junto com funções/funcionalidades e testes automatizados
Durante o desenvolvimento, crie alertas adequados e de alta qualidade no código para reduzir o tempo médio de detecção (MTTD) e o tempo médio de isolamento (MTTI)
Crie monitores para garantir que os serviços dependentes funcionem conforme o esperado
Reserve um tempo para a criação dos painéis necessários e treine os membros da equipe para utilizá-los
Planeje “simulações” do serviço para garantir que os monitores funcionem conforme o esperado e identifiquem monitores ausentes
Durante os sprints, planeje o encerramento de ações de revisões de incidentes anteriores, sobretudo aquelas relacionadas à construção de monitores ausentes e automação
Construa detectores para segurança (upgrades/patches/credenciais rotativas)
Cultive a mentalidade de “medir e monitorar tudo” com a automação determinando a resposta aos alertas detectados

Ferramentas de monitoramento de DevOps

Complementando um conjunto de práticas de monitoramento saudáveis estão as ferramentas avançadas que se alinham à cultura do DevOps/YBIYRI. É preciso ter atenção para identificar e implementar ferramentas de monitoramento, além de ferramentas de desenvolvedor bem compreendidas para repositórios de código, IDEs, depuradores, rastreamento de defeitos, ferramentas de integração contínua e ferramentas de implementação.

Um único painel de vidro oferece uma visão abrangente dos vários aplicativos, serviços e dependências de infraestrutura, não só na produção, mas também no staging. Assim, você tem a capacidade de provisionar, ingerir, marcar, visualizar e analisar a integridade de ambientes distribuídos complexos. Por exemplo, a ferramenta de PaaS interna Micros, da Atlassian, inclui uma ferramenta chamada microscópio, que apresenta todas as informações sobre os serviços de maneira concisa e detectável.

Captura de tela do painel único de vidro

O monitoramento do desempenho do aplicativo é essencial para garantir que os indicadores de desempenho específicos do aplicativo, como tempo para carregar uma página, latências de serviços downstream ou mudanças de status, sejam monitorados, além das métricas básicas do sistema, como uso de CPU e memória. Ferramentas como SignalFX e NewRelic são ótimas para observar dados de métricas em tempo real.

Implemente diferentes tipos de monitores, inclusive para erros, transações, sintéticos, batimentos cardíacos, alarmes, infraestrutura, capacidade e segurança durante o desenvolvimento. Verifique se todos os membros foram treinados nessas áreas. Esses monitores em geral são específicos do aplicativo e precisam ser implementados com base nos requisitos de cada aplicativo. Por exemplo, a equipe de desenvolvimento do Opsgenie implementa monitores sintéticos que criam um alerta ou incidente e verificam se o fluxo de alerta é executado conforme o esperado (ou seja, se integrações, roteamento e políticas estão funcionando corretamente). Também implementamos monitores sintéticos para dependências de infraestrutura, que verificam a funcionalidade de vários serviços da AWS periodicamente.

Um sistema de gerenciamento de incidentes e alertas que se integre com perfeição às ferramentas da equipe (gerenciamento de registros, relatórios de falhas, entre outras), para se encaixar naturalmente ao ritmo operacional e de desenvolvimento da equipe. A ferramenta deve enviar alertas importantes para os canais de notificação de sua preferência com as latências mais baixas. Ela também deve incluir a capacidade de agrupar alertas para filtrar vários deles, em especial quando diversos alertas são gerados a partir de um único erro ou falha. Na Atlassian, não só oferecemos o Opsgenie como um produto que oferece esses recursos aos clientes, mas também o usamos internamente para garantir que tenhamos um sistema de gerenciamento de alertas e incidentes robusto, flexível e confiável, integrado às práticas de desenvolvimento.

Conclusão...

Ao adotar o DevOps, é importante garantir o "shift-left" do monitoramento, além dos testes. As práticas e ferramentas também devem ser implementadas para cumprir a promessa de entregar mudanças rápidas e com alta qualidade na produção.

Para obter mais informações, confira esses recursos adicionais da Atlassian sobre DevOps, gerenciamento de incidentes e gerenciamento de alterações.

Aplicativos apresentados

Collections da Atlassian

Por caso de uso

Por equipe

Por tamanho

Por setor

Suporte

Recursos

Jira

Confluence

Jira Service Management

Por caso de uso

Por equipe

Por tamanho

Por setor

Jira

Confluence

Jira Service Management

Por caso de uso

Por equipe

Por tamanho

Por setor

Monitoramento de DevOps

O que é monitoramento de DevOps?

Monitoramento de DevOps versus observabilidade

A importância do monitoramento de DevOps

Mudanças frequentes de código exigem visibilidade

Colaboração automática

Experimentação

Gerenciamento de alterações

Monitoramento dependente do sistema

Principais recursos do monitoramento de DevOps

Teste de "shift-left"

Gerenciamento de alertas e incidentes

Ferramentas de monitoramento de DevOps

Conclusão...

Recomendado para você

Comunidade de DevOps

Caminho de aprendizagem de DevOps

Comece de graça