Contents

Revelando o VideoPoet!

O Google revelou recentemente uma instância inovadora de inteligência artificial generativa que é capaz de produzir videoclipes de três segundos altamente versáteis e concisos.

/images/google-videopoet-1200x675.jpg

O Google revelou recentemente um novo projeto conhecido como VideoPoet, que mostra a incursão da empresa no domínio da IA ​​generativa. Essa tecnologia inovadora produz vídeos curtos em formato vertical de 2 segundos que deixaram os internautas maravilhados. O que diferencia o VideoPoet é sua notável flexibilidade em atender às preferências individuais. Além de criar vídeos baseados exclusivamente em entrada de texto, essa IA também pode gerar conteúdo a partir de imagens, outros vídeos ou até mesmo incorporar trilhas sonoras a vídeos existentes.

O terreno difícil da geração de vídeo

A geração de um vídeo envolve diversas complexidades além de simplesmente reunir quadros ou imagens individuais. Para criar uma narrativa visual coerente, sistemas de inteligência artificial como ChatGPT e MidJourney devem considerar vários fatores, como continuidade entre quadros sucessivos, manutenção da consistência nas condições de iluminação, garantia de realismo por meio de simulações físicas precisas e adesão a parâmetros predefinidos, como duração e conteúdo. Esses desafios dificultam que as atuais tecnologias de IA produzam vídeos mais longos com cenas complexas, resultando em limitações em sua duração. Por exemplo, o software VideoPoet do Google gera clipes que duram apenas cerca de dois segundos devido a essas restrições inerentes.

As demonstrações do Google deixaram uma impressão indelével em mim, especialmente considerando que a corporação parece ser incapaz de produzir conteúdo visual sem primeiro oferecer algum material de referência inicial como base. Conseqüentemente, somos presenteados com “um tubarão emitindo um raio laser pela boca” ou “uma raposa de origami vagando por uma paisagem florestal”. Parece que um dos exemplos mais engraçados envolve evocar “uma mulher bocejando

A geração de áudio exibida por estes modelos é verdadeiramente notável. Eles são capazes de gerar uma trilha de áudio de acompanhamento para uma determinada entrada visual, totalmente independente de qualquer orientação textual. Por exemplo, se for apresentado um vídeo de um gato tocando piano, a IA pode produzir algumas notas musicais que correspondem à sua compreensão da cena. Da mesma forma, quando recebe imagens de um trem a vapor percorrendo os trilhos, a IA gera os sons distintos associados a tal locomotiva.

Para demonstrar suas proezas, o Google optou por colaborar com seu inovador VideoPoet AI e Google Bard, gerando uma ampla gama de entradas de comandos que foram posteriormente executadas pelo VideoPoet para produzir aproximadamente trinta videoclipes individuais de dois segundos. Posteriormente, esses segmentos foram habilmente integrados em uma narrativa coesa de sessenta segundos pela empresa.

A presente exposição sublinha as limitações desta inteligência artificial. As transições entre as cenas carecem de coerência e os resultados visuais não conseguem corresponder à qualidade das produções estacionárias mais recentes do MidJourney.

Na verdade, a geração de vídeos através da inteligência artificial é um avanço que os especialistas em IA estão a esforçar-se, e parece que o Google fez algum progresso nesta área com a sua tecnologia VideoPoet. À medida que olhamos para o futuro, o potencial destes tipos de sistemas generativos de IA para criar conteúdo em plataformas como o YouTube ou o TikTok é bastante promissor.

*️⃣ Link da fonte:

demos apresentadas pelo Google ,