2023/12/04

Como funcionam os LLM usados na AI

Quem tiver curiosidade, poderá ver como funcionam os modelos LLM utilizados actualmente nos sistemas de inteligência artificial.

A maioria das pessoas saberá que o processamento destes modelos LLM (Large Language Models) é bastante intensivo, mas provavelmente sem fazer ideia do que é que isso representa. Mas agora é algo que podem ver de forma interactiva neste visualizador 3D de LLM, que explica, e mostra, todos os passos do processo.
São contas e mais contas, para um exemplo simples, e o mais impressionante é olhar para a diferença entre os diferentes modelos. O modelo nano-gpt apresentado parece ter uma incrível complexidade, mas quando posto em perspectiva ao lado de um modelo como o GPT-2 (XL) parece um simples ponto; e o GPT-2 (XL) torna-se também num pequeno bloco quando comparado com o GPT-3.
De qualquer forma, é algo que poderá auxiliar todos os interessados em sistemas de inteligência artificial a perceberem um pouco melhor o funcionamento do "transformer model" usado por estes LLM.

Sem comentários:

Enviar um comentário (problemas a comentar?)