Nessa quarta-feira (02), a Meta lançou uma plataforma de inteligência artificial generativa capaz de criar sons e músicas a partir de textos. Intitulada como AudioCraft, por enquanto a ferramenta está disponível apenas para pesquisas, mas deve ser liberada em breve para todos.
A Meta divulgou que a ferramenta será útil para muitos públicos, tendo em vista que ela irá permitir que profissionais como músicos e desenvolvedores de jogos possam usá-la para criar novas composições e criar efeitos sonoros, por exemplo.
É possível entender um pouco de como a tecnologia funciona a partir de amostras de áudio divulgadas pela empresa. Confira:
Treinamento do AudioCraft
A plataforma de IA é composta por três modelos, que são MusicGen, AudioGen e EnCodec.
O MusicGen foi treinado com músicas licenciadas e de propriedade da Meta, o que o torna capaz de gerar músicas a partir de prompts de textos.
O AudioGen foi treinado a partir de efeitos sonoros públicos, o que fez a plataforma ser capaz de criar áudios mais comuns, como sirenes e canto de pássaros, também a partir de prompts de texto.
Já o EnCodec é um decodificador de gravações sonoras que entrega resultados com uma qualidade alta, mesmo com arquivos comprimidos. Esse modelo recebeu melhorias após ser anunciado no ano passado.
Atualmente, o AudioCraft está sendo disponibilizado em código aberto para que desenvolvedores e pesquisadores possam contribuir com o aprimoramento do recurso.
Via: TecMundo
Imagem: Muhammad Asyfaul/Unsplash