Lançamento da Meta: IA para Extração de Áudio
A Meta acaba de lançar um modelo de inteligência artificial (IA) revolucionário, conhecido como SAM Audio, que permite extrair áudio de diferentes tipos de arquivos de forma eficiente. Este modelo é capaz de isolar sons por meio de três tipos distintos de prompt, abrindo novas possibilidades para a edição de áudio e vídeo.
De acordo com a empresa, a abordagem intuitiva do SAM Audio pode modificar a forma como as pessoas interagem com o som, tornando recursos antes restritos a profissionais mais acessíveis ao público geral. Isso pode ter um impacto significativo em áreas como música, podcasts, televisão, cinema, pesquisa científica, acessibilidade e muito mais.
Funcionalidades do SAM Audio
O SAM Audio oferece três tipos de prompts para isolar áudios de arquivos:
- Prompt de texto: permite digitar comandos simples, como “latido de cachorro”, “voz cantando” ou “guitarra”, para isolar um som específico.
- Prompt visual: usuários podem clicar na pessoa ou no objeto de um vídeo que esteja emitindo som para isolar o áudio correspondente.
- Prompt de intervalo: possibilita marcar segmentos de tempo nos quais está o áudio que se deseja extrair.
Essas funcionalidades podem ser usadas individualmente ou de forma combinada, oferecendo uma grande flexibilidade para os usuários. Além disso, o SAM Audio foi integrado à coleção Segment Anything, que também reúne recursos voltados à edição de imagens, vídeos e cenas em 3D.
Os usuários interessados podem acessar os recursos do SAM Audio no Segment Anything Playground, onde é possível experimentar as funcionalidades com uma coleção de áudios e vídeos disponibilizada pela empresa ou fazer o upload de arquivos próprios para explorar o modelo.
Este conteúdo pode conter links de compra.
Fonte: link