2020/11/03

Netflix explica como consegue manter o serviço em caso de problemas

A Netflix revelou alguns detalhes do sistema que tem nos bastidores para assegurar que os clientes consigam ver filmes e séries mesmo quando há problemas.

Garantir que os clientes não ficam sem acesso aos conteúdos é de importância crítica para a Netflix, e depois de alguns casos complicados no passado a empresa revelou alguns detalhes do sistema que desenvolveu para tentar impedir que problemas se possam alastrar ao ponto de causar uma falha catastrófica.

Já temos tido a demonstração que não há clouds que possam ser garantidas a 100%. No caso da Netflix a premissa foi a: se é assumido que poderão existir problemas, vamos pelo menos tentar assegurar que a coisa possa ser gerida de forma a que os cliente nem sequer notem que eles aconteceram.

Para isso criaram um sistema chamado Zuul (quem tiver visto o Ghostbusters original compreenderá a referência) que é capaz de reagir às diferentes condições de todo o sistema, e imediatamente começar a cortar nas coisas consideradas menos prioritárias, sempre com o objectivo de salvaguardar a capacidade dos clientes continuarem a ver aquilo que estiverem a ver.

Não demorou para que o sistema tivesse que mostrar o que vale. Este ano a Netflix enfrentou novo problema idêntico ao que em 2019 fez com que alguns clientes ficassem impedidos de ver contúdos durante bastante tempo, só que o Zuul entrou em acção e cortou nos acessos não prioritários, permitindo que o sistema recuperasse e regressasse à normalidade sem que os clientes notassem qualquer interrupção.

1 comentário:

  1. Já utilizei o zuul como reverse proxy num webservice, mas nunca tive a oportunidade de explorar o seu verdadeiro poder. O Netflix tem bibliotecas open source fantásticas para desenvolvimento na cloud

    ResponderEliminar