Gere vídeos em seu PC simples!

Benjamin Kawaski included in Artificial Intelligence Company Stable Diffusion

2023-11-22 400 words 2 minutes

Contents

Stability.ai apresenta uma abordagem inovadora para gerar vídeos com sua solução local chamada Stable Video Diffusion. Esta inteligência artificial generativa foi projetada para processamento local e não requer qualquer dependência de serviços em nuvem, proporcionando aos usuários controle aprimorado sobre seus dados, ao mesmo tempo que mantém a produção de vídeo de alta qualidade.

Na verdade, tem havido muita discussão sobre a utilização de tecnologias avançadas de inteligência artificial generativa, como ChatGPT, Dall-E e Midjourney, na indústria. No entanto, deve notar-se que estas inovações necessitam de recursos computacionais substanciais fornecidos através de infraestruturas baseadas em nuvem. Em contraste, a Difusão Estável oferece a vantagem de poder operar localmente no computador pessoal de um indivíduo para gerar conteúdo de imagem estática e sequências de vídeo dinâmicas.

A Stability AI revelou recentemente uma solução inovadora de código aberto conhecida como Stable Video Diffusion, marcando a instância inaugural em que a organização é capaz de produzir vídeos através de sua tecnologia de ponta.

Vídeos de 2 segundos

Atualmente, o Stable Video Diffusion restringe suas capacidades de difusão de vídeo a clipes de apenas dois segundos, com resolução de 1024x576 pixels, o que parece bastante arcaico à luz da atual era 4K. Especificamente, a inteligência artificial generativa utilizada produz uma série de 25 imagens que se alinham às necessidades do usuário.

A principal dificuldade associada ao desenvolvimento de tais modelos diz respeito à criação de vídeos em oposição a imagens estáticas. Para produzir uma narrativa visual coerente e contínua, é necessário produzir uma série ininterrupta de quadros que mantenham a consistência visual enquanto exibem uma progressão plausível dentro do cenário retratado.

A iteração atual da nossa tecnologia é capaz de transformar imagens estáticas em vídeos dinâmicos através de um processo conhecido como “síntese de vídeo”. No entanto, temos planos ambiciosos para futuras iterações que nos permitirão gerar vídeos baseados em comandos verbais fornecidos em linguagem natural. Isto representa um avanço significativo em termos de funcionalidade e experiência do usuário e ressalta nosso compromisso de permanecer na vanguarda das tecnologias de IA de ponta.

A vantagem deste modelo reside na sua capacidade de funcionar eficientemente num computador pessoal padrão. Na verdade, os usuários podem acessar facilmente e começar a utilizar o Stable Video Diffusion por meio de nosso repositório no GitHub, mesmo ao empregar uma GPU poderosa como a NVIDIA GeForce RTX 4090 para desempenho aprimorado.

*️⃣ Link da fonte:

anunciou um novo modelo ,