2023/11/26

Curiosos criam AIs sem limites nem restrições

Enquanto os modelos AI das grandes empresas na área vão sendo limitados para evitar polémicas, há cada vez mais modelos afinados por pessoas individuais para escaparem a essas restrições.

Nos últimos anos já se tinha tornado comum que qualquer assistente AI experimental lançado por uma grande empresa fosse, logo de seguida, retirado do mercado por alguém ter encontrado forma de o colocar a dizer coisas racistas, insultuosas, e ofensivas. Os mais recentes modelos, como o ChatGPT, têm resistido e ficado no mercado, mas também eles têm sofrido ajustes constantes para tentarem reduzir o seu uso nesses cenários abusivos - ao ponto de agora até se recusarem a dar receitas "perigosamente picantes", ou de se recusarem a fazer contas matemáticas em que as variáveis tenham nomes como "perigosas" ou "antiética". Em resultado dessas limitações crescentes, não será surpresa que se criem alternativas menos restritivas.

É precisamente isso o que tem sido feito, usando como base modelos AI open-source. Embora estes modelos já contem com algumas limitações implícitas oriundas dos dados usados para a sua criação, podem ser facilmente adaptados para não conterem todas as regras adicionais que lhes são normalmente aplicadas (como aquelas que tentam evitar que um assistente auxilie o utilizador a fazer bombas, ou a planear um "crime perfeito").

Também já vimos exemplos de como, mesmo com estas regras, muitas vezes se podem enganar os modelos AI de forma criativa, dizendo que se está a fazer um filme - tendo também havido um caso em que alguém argumentou, com sucesso, que o mundo tinha acabado e já não existiam humanos no planeta, e que as regras anteriormente aplicada já não faziam sentido. Mas, já se sabia que, por muito que se queiram controlar e limitar os modelos AI, haverá sempre quem goste de quebrar as regras; que neste caso se traduz em remover ou não aplicar regras, e deixar que os modelos AI possam ser levados ao limite.

Sem comentários:

Enviar um comentário (problemas a comentar?)