A Clockwork anunciou hoje um novo serviço que usa seu serviço de sincronização de relógio para eliminar quedas de pacotes e ajudar as empresas a melhorar seu desempenho de rede.
Há um ano, a empresa causou sensação ao anunciar seu serviço de sincronização de relógio, que ajuda as empresas a manter seus servidores sincronizados. Manter os relógios sincronizados com precisão de até 5 nanossegundos (para carimbos de data/hora baseados em hardware) é uma grande conquista, mas a ideia aqui sempre foi aumentar a pilha e construir ferramentas com base nessa tecnologia fundamental. A primeira ferramenta, Latency Sensei, fornece aos usuários dados detalhados sobre a latência em suas redes. Agora, a Clockwork está agregando esta ferramenta com outros recursos e um novo painel de ‘sense-and-control’ para gerenciar todos eles, com o objetivo de ajudar as empresas a reduzir a latência da rede, o jitter e praticamente eliminar quedas de pacotes entre suas máquinas, independentemente da localização ou da computação. ambientes.
Tradicionalmente, para reduzir quedas de pacotes (e essas quedas e suas retransmissões são características fundamentais do TCP que fazem a internet funcionar), os switches de rede usam buffers. Mas, como o cofundador da Clockwork e professor de ciência da computação de Stanford, Balaji Prabhakar, observou durante uma entrevista na KubeCon Europe no início deste mês, isso vem com muita sobrecarga.
As medições unidirecionais, argumentam as equipes da Clockwork, são um indicador muito mais preciso de congestionamento do que as quedas de pacotes e, na demonstração da empresa, simplesmente ativar esse recurso de controle de congestionamento do Packet Rocket, como a empresa o chama, reduz a perda de pacotes para quase zero enquanto reduzindo a latência e aumentando a utilização da largura de banda. Isso quase parece bom demais para ser verdade, mas a Clockwork pode apoiar essas afirmações e a empresa já tem vários clientes corporativos que testaram com sucesso a plataforma Cloud Deluxe geral.
“Se tivermos relógios precisos nas redes, a primeira coisa que fazemos é medir o congestionamento com muita precisão – uma via, não o tempo de ida e volta dividido por dois. Em segundo lugar, se você puder fazer a medição unidirecional com rapidez e precisão, poderá realmente controlar o congestionamento de uma forma que não poderia fazer antes”, explicou Prabhakar. “Porque a maior parte do problema com o congestionamento da rede, se você não quer ir para quedas de pacotes – essa é a opção nuclear – se você não quer chegar perto disso, as pessoas sempre dizem: aqui está um buffer.” Descobrir como medir o congestionamento com precisão é difícil, no entanto, e mesmo com um buffer grande, são necessárias várias quedas de pacotes (e a sobrecarga associada a elas) antes que o sistema atinja o limite necessário para entrar em ação.
Créditos da imagem: Sistemas Mecânicos
Com essa tecnologia central instalada, a Clockwork também pode alocar facilmente a largura de banda para uma determinada máquina virtual e/ou priorizar o tráfego com base nas necessidades de um determinado aplicativo. Com os dados de latência em vigor, a empresa também pode descobrir quais máquinas provavelmente estão localizadas no mesmo host físico, permitindo que as empresas movam cargas de trabalho para evitar o problema de irmãos ruidosos.
“Relógio Systems está nos ajudando a obter melhor visibilidade em nosso complexo ambiente multinuvem”, disse Albert Greenberg, vice-presidente de engenharia de plataforma da Uber. “MecânicaA tecnologia inovadora da pode identificar gargalos de congestionamento com medições precisas de latência – e corrigir o problema eliminando atrasos de pacotes e eliminando quedas de pacotes. Estamos impressionados com os testes até agora e estamos explorando o potencial para MecânicaCloud Deluxe da empresa para nos ajudar a construir uma infraestrutura de rede de alto desempenho sobre ambientes de nuvem genéricos.”
Em breve, Prabhakar me disse, a empresa também será capaz de permitir uma melhor captura instantânea do estado da rede para backups e recuperação de desastres. Tradicionalmente, para obter um instantâneo preciso do estado da rede, você teria que pausar o aplicativo, esperar que os pacotes chegassem ao destino e então criar o instantâneo. Mas com relógios mais precisos, é possível dizer simplesmente: todas as VMs fazem uma pausa de alguns nanossegundos, esperam alguns milissegundos para que tudo que ainda está em voo pouse, tiram o instantâneo e retomam.
Tudo isso agora é alimentado pela API UniChron da Clockwork, que permite aos usuários definir limites dinâmicos na precisão do relógio e é controlado por meio do novo painel de controle interativo da empresa. A empresa também oferece acesso programático a todos os recursos por meio de APIs.