2019/09/23

A.I. aprende a jogar às escondidas com tácticas surpreendentes


É sempre curioso ver os resultados de sistemas de A.I. deixados a aprender por si só ao longo de milhares de tentativas, e foi precisamente isso que aconteceu num cenário competitivo de duas equipas A.I. onde uma tinha que apanhar a outra.

Recentemente vimos um sistema a aprender a estacionar sozinho, ao longo de milhares e milhares de tentativas. Desta vez a situação tornou-se ainda mais cómica, e interessante, por contar com duas equipas adversárias, que foram desenvolvendo várias tácticas em adaptação ao que a outra estava a fazer.

Foram necessários milhões de tentativas para que as equipas "percebessem o jogo", em que uma equipa tinha que apanhar os elementos da outra equipa (e estes tentarem fugir). Mas a partir daí as coisas começaram a tornar-se muito mais interessantes. Nos mapas existiam vários elementos que podiam ser movidos ou bloqueados pelos jogadores. Com isso, a equipa à defesa começou a perceber que podia construir abrigos, movendo peças em seu redor e bloqueando-as.


Parecia que a situação estava resolvida... mas não. A equipa atacante aprendeu a usar as rampas, para subir acima das paredes e apanhar os seus inimigos. E o que se seguiu? A equipa à defesa começou a "roubar" ou bloquear as rampas, para que não pudessem ser utilizadas pela equipa adversária.


Também curioso é que para isto aprendeu a trabalhar em equipa, já que não havia tempo para que um único jogador pudesse fazer tudo. Um deles podia ir buscar ou bloquear as rampas, enquanto o outro ia tratando de criar o seu abrigo.

E assim parecia estar tudo terminado... mas não. Os atacantes, ainda assim, conseguiram aprender uma táctica final: uma vez que não podiam mover as rampas, aprenderem a levar blocos normais até às rampas, trepando para cima do bloco, e depois empurrando o bloco ao longo do mapa, para conseguir apanhar os oponentes passando por cima dos muros.


Claro que a resposta não se fez esperar, em vez de se limitarem a bloquear as rampas, os defensores começaram a bloquear todos os elementos do mapa, deixando os oponentes sem "ferramentas" para trabalhar.


Mas a táctica de subir para uma caixa não foi a única táctica curiosa que estes sistemas A.I. aprenderam. Aprenderam também coisas como correrem sem nunca pararem (em mapas sem limites) para nunca serem apanhados; atirarem as rampas para fora do mapa; ou até a usarem as rampas para se projectarem no ar e conseguirem ver os inimigos.

Em conclusão: não se deve subestimar a capacidade de aprendizagem destes sistemas de A.I. mesmo que para tal possam ser necessários milhões e milhões de tentativas. :)


1 comentário:

  1. Isto prova que, no futuro será virtualmente impossível voltarmos a conseguir ter pessoas como o Edward Snowden ou Rui Pinto a desmascararem podres dos poderosos das sociedades.

    ResponderEliminar

[pub]