A indústria de TI está em uma encruzilhada, saiba como o NRE garantirá a confiabilidade da rede de seu negócio. 

A rede

Para quase todos os negócios, a rede, é uma infraestrutura crítica para a maior parte das organizações do planeta, mas como elas podem garantir sua confiabilidade? Historicamente, este foi o papel do engenheiro de rede em grandes empresas, como o Facebook ou o Google.

Dentro dessas organizações, os engenheiros de rede precisavam tocar em todos os tipos de sistemas, dentro e fora da rede, desde roteadores e switches até servidores, armazenamento, aplicativos e ferramentas de monitoramento, tudo com o único objetivo de manter a rede em funcionamento e fornecer conectividade para aplicativos e usuários.

Acontece que o Facebook e o Google não são as únicas empresas que se preocupam (ou devem se preocupar) com a confiabilidade. Atualmente, o custo de uma interrupção na rede quase sempre é medido na casa dos seis dígitos e, para muitas organizações, pode ser ainda pior.

O tempo para esperar que uma interrupção na rede não ocorra acabou. É hora de projetar ativamente contra esses riscos — e é exatamente este o papel da engenharia de confiabilidade de rede, ou Network Reliability Engineering.

Velocidade, confiabilidade e eficiência de rede: como conquistar?

Em um mundo moldado pela tecnologia, a automação ajuda as empresas a se moverem rapidamente e serem eficientes. Enquanto isso, o valor fundamental das operações da rede é a confiabilidade constante. O Network Reliability Engineering é uma abordagem da automação de rede que estabiliza e melhora a confiabilidade enquanto obtém os benefícios da velocidade.

O uso estratégico da tecnologia é a força motriz por trás de muitos ganhos de receita e produtividade atuais. No clima competitivo de negócios de hoje, os vencedores são aqueles que aprendem e se adaptam mais rapidamente à tecnologia.

Como o digital desempenha um papel cada vez mais importante na modelagem da experiência do cliente e na inovação, a TI está sob tremenda pressão para fornecer esse tipo de velocidade em escala. Com base em décadas de experiência em Transformação Digital e discussões sobre metodologia de TI, o DevOps está introduzindo uma nova cultura e um novo conjunto de processos que proporcionam velocidade de negócios.

O Instituto de Pesquisa e Avaliação do DevOps (DORA) confirmou os resultados de vários estudos anuais que mostram que as organizações que migraram para o DevOps estão melhorando continuamente o desempenho, enquanto aquelas que mantiveram o status quo de TI não estão apenas estáticas, mas estão ficando para trás.

Enquanto o DevOps se concentra em fornecer velocidade, o dogma clássico da TI mantém que as empresas devem sacrificar a velocidade para obter outros ganhos, como eficiência e, principalmente, confiabilidade. Por meio da automação, no entanto, muitas organizações provaram que é possível obter todos os três benefícios simultaneamente.

A transformação do DevOps como engenharia de confiabilidade

O DevOps permite fornecer feedback mais rápido e reduzir os prazos através de entregas em pequenos lotes. De fato, esta é uma receita comprovada para melhoria contínua e que exige automação juntamente com um pipeline automatizado para gerar otimização nas respostas, planejamento de capacidade e planejamento de recursos.

O DevOps também apresenta muitos princípios e práticas culturais. Em situações em que ele não fornece descrições de tarefas ou implementa processos abstratos, no entanto, a engenharia de confiabilidade do site (Site Network Engineering — SRE) entra em ação, oferecendo uma solução para as equipes de entrega e operações de software.

À medida que a engenharia de confiabilidade do site cresce em popularidade, as equipes de operações de rede que procuram redirecionar sua abordagem à automação atribuíram um apelido semelhante aos seus próprios processos — engenharia de confiabilidade de rede (NRE — Network Reliability Engineering) – e se referem ao seu pessoal como “engenheiros de confiabilidade de rede”.

Automatizando a confiabilidade em primeiro lugar e a velocidade em segundo

Uma diferença importante entre o fornecimento de software para serviços de negócios e para serviços de infraestrutura de rede é que as redes não exigem tanta inovação e ajustes contínuos. Portanto, na infraestrutura — especialmente na rede — a confiabilidade é intuitivamente mais importante do que as vantagens de se mover rapidamente.

No entanto, quando se trata de engenheiros de confiabilidade do site e de rede, verifica-se que a confiabilidade, embora menos atraente, sempre deve ser priorizada em detrimento da velocidade. Isso ocorre porque, em algumas circunstâncias, sem confiabilidade, a velocidade é irrelevante — assim como a velocidade de escape de um foguete não importa se ele explode logo após o lançamento. Um foco de confiabilidade primeiro garante que você chegue longe o suficiente para ir rápido e sustente essa velocidade. Embora a segurança e o desempenho do tráfego possam ser objetivos de confiabilidade mensuráveis ​​para os engenheiros de rede, a disponibilidade é inerentemente mais valiosa porque, sem ela, nada mais importa.

Projetando para garantir a confiabilidade da rede

A simplicidade na arquitetura de rede e na tecnologia de automação é um pré-requisito para automatizar a confiabilidade geral das operações de rede. Por exemplo, grandes dispositivos de expansão herdados obviamente prejudicam a confiabilidade porque não são apenas pontos únicos de falha, são também muito complexos e difíceis de mudar.

Isso levou a situações em que os dispositivos de rede não podem ficar offline sem interromper os negócios, e os complexos recursos do sistema operacional de rede requerem acrobacias complicadas para obter atualizações de software durante o serviço.

As arquiteturas de expansão não são apenas úteis para a escala, mas também promovem a tolerância a falhas. Felizmente, os modernos protocolos de rede e a automação de software melhoram a saúde do ecossistema, bem como da rede em geral.

Isso é verdade para a internet, é claro, bem como para as arquiteturas de rede. Embora essas arquiteturas tenham sido reservadas para grandes data centers, agora são cada vez mais encontradas em muitos outros domínios de rede.

Um segundo exemplo de simplicidade que permite confiabilidade pode ser encontrado na automação. Onde números maiores beneficiam a confiabilidade da arquitetura, o oposto é verdadeiro quando se trata de software.

Quando as redes incluem muitas plataformas SDN e sistemas operacionais de dispositivos, a diversidade de APIs proíbe a portabilidade dos fluxos de trabalho de automação e impede a confiabilidade.

Ferramentas e APIs homogêneas que podem funcionar em muitos casos de uso de automação simplificam bastante o aprendizado humano, enquanto mais testes e fortalecimentos melhoram a confiabilidade.

A tecnologia de automação reduzirá o trabalho diário de tarefas repetitivas que levam a erros não intencionais. Ela também fornece as bases para garantir a aderência aos SLAs. Os SLAs e a confiabilidade da rede são alcançados através do poder do Network Reliability Engineering e dos seus engenheiros.

Gostou do nosso artigo? Comente abaixo e compartilhe suas ideias e dúvidas conosco!