Temos AIs a gerar imagens a partir de texto, como o Dall-E e Imagen, e que até já se está a expandir à criação de vídeo. Por isso, não será propriamente uma surpresa que também se possível aplicar o mesmo conceito à geração de música.
É precisamente isso que o faz o MusicML da Google. Tal como nos casos das imagens, apenas precisamos dar uma descrição do que queremos, que pode ser tão complexa quanto se deseje, como no exemplo seguinte que é "A fusion of reggaeton and electronic dance music, with a spacey, otherworldly sound. Induces the experience of being lost in space."
Mas, as suas capacidades não se ficam por aqui, também é possível criar cenários sonoros mais complexos, em que se começa com um estilo e depois se faz a transição para outros; e talvez ainda mais impressionante, podemos dar-lhe um exemplo inicial com alguém a cantarolar um pequeno trecho com a voz, e pedir-lhe que ele recrie aquilo com diferentes instrumentos musicais, ou até com inspiração em outras músicas, com resultados surpreendentes.Yesterday, Google published a paper on a new AI model called MusicLM.
— Product Hunt 😸 (@ProductHunt) January 27, 2023
The model generates 24 kHz music from rich captions like "A fusion of reggaeton and electronic dance music, with a spacey, otherworldly sound. Induces the experience of being lost in space." pic.twitter.com/XPv0PEQbUh
Infelizmente, e ao estilo do LaMDA mostrado em 2021, a Google não tem ainda intenções de disponibilizar este sistema publicamente. Mas, talvez com a pressão da OpenAI e do ChatGPT, as coisas comecem a mudar.
Sem comentários:
Enviar um comentário (problemas a comentar?)