Contents

"Liberando o poder do AI Genie do Google DeepMind

Publicado em 28 de fevereiro de 2024 às 19h05. por cabeçalho do artigo

Genius é apresentado pelo Google DeepMind como “o primeiro ambiente interativo generativo que foi treinado de maneira não supervisionada com vídeos da Internet não rotulados”. “Um conjunto de dados de mais de 200 horas de vídeos de jogos de plataforma 2D públicos foi usado para um modelo final de IA de 11 bilhões de parâmetros.

Embora originalmente sejam apenas dados de vídeo, o modelo de IA é capaz de converter qualquer quadro em um mundo 2D jogável. Pesquisador e chefe da equipe Open-Endedness do Google DeepMind, Tim Rocktäschel fala para gerar uma variedade infinita de mundos 2D controláveis ​​por ação a partir de prompts de imagem.

Genie exibe uma capacidade impressionante de aprendizagem não supervisionada, permitindo-lhe decifrar várias ações ocultas que governam os personagens do jogo com notável consistência. Se a Genie concentrasse seus esforços na geração de jogos bidimensionais, seu potencial se expandiria significativamente, beirando o domínio da inteligência artificial.

Não visualmente talentoso como Sora, mas…

O resultado é insignificante em comparação com a aclamação conquistada pelo modelo Sora da OpenAI, que gerou sequências de vídeo altamente convincentes com base em informações textuais e alimentou especulações sobre a iminência da inteligência artificial geral. No entanto, Tim Rocktäschel enfatiza que há uma distinção importante a ser feita em relação a este novo desenvolvimento.

“Certamente, o Sora da OpenAI é verdadeiramente impressionante e visualmente deslumbrante, mas um modelo do mundo precisa de ações. “Tim Rocktäschel destaca particularmente as críticas nesse sentido do pesquisador de inteligência artificial Yann Le Cun (Meta), o pioneiro da tecnologia neural artificial redes.

/images/genie-ia-google-deepmind_0514032001695280.jpg

A estimada equipe do Google DeepMind revelou recentemente uma impressionante plataforma baseada na web conhecida como “Genie”, que é capaz de transformar uma miríade de entradas visuais, como aquelas geradas pelo modelo avançado Imagen2, desenhos rudimentares e fotografias, em uma gama diversificada de ações correspondentes.

Jornalista deste site especializado em novas tecnologias

*️⃣ Link da fonte:

Tim Rocktäschel fala , site no Genie ,