Contents

O confronto final contra o GPT-4!

Publicado em 6 de dezembro de 2023 às 18h30. por cabeçalho do artigo

O projeto provavelmente é importante demais para esperar. O boato de um adiamento do lançamento da nova inteligência artificial multimodal do Google não terá durado muito e o Google finalmente anuncia seu modelo de IA agora Gemini 1.0 projetado com Google DeepMind.

Mencionado discretamente em maio passado durante a conferência Google I/O 2023 para dar total liberdade à apresentação do agente conversacional Google Bard, Gemini é, no entanto, o modelo de IA multimodal que deve ter seu próprio GPT-4 do OpenAI, já em funcionamento sozinho e em produtos e serviços da Microsoft.

/images/gemini-logo_0633053401693446.jpg

Demis Hassabis, o estimado líder da divisão DeepMind do Google, elogiou a mais recente criação de sua equipe como “uma conquista incomparável em inteligência artificial”, ostentando seu design multimodal inovador que permite lidar sem esforço com uma variedade de formatos multimídia, como texto, código , áudio, imagens e vídeos, ao mesmo tempo que exibe notável adaptabilidade e compreensão.

Multiple Gemini, um modelo de IA multimodal

O Gemini 1.0 tem a capacidade inerente de lidar com uma variedade de tipos de solicitações em vários formatos, interpretar seus significados pretendidos e fornecer respostas correspondentes com base em seu entendimento.

A inteligência artificial tem a capacidade de perceber objetos, determinar atributos compartilhados, formar conexões pertinentes entre conceitos e compreender objetivos com base em informações limitadas.

O modelo de IA está configurado para escolher entre três iterações, cada uma fornecendo recursos e funcionalidades exclusivas.

-Gemini Ultra: o mais poderoso, para tarefas de alta complexidade -Gemini Pro: o mais versátil, para usos padrão -Gemini Nano: o mais eficaz, aquele que devemos encontrar em dispositivos eletrônicos (smartphones, computadores) porque foi projetado para dispositivos embarcados

O Google e a DeepMind anunciam ter testado o Gemini em muitos benchmarks específicos de IA para texto (compreensão de consulta, raciocínio, cálculo, código, etc.) e em multimodal e obtiveram pontuações superiores às do GPT-4 na maioria dos casos.

/images/google-gemini-ultra-pro-nano_0780043801693445.jpg

Seu design multimodal desde o início, com aprendizado de fontes variadas, em vez de treinamento em cada tipo de tarefa e agregação de treinamento, explicaria suas capacidades superiores, diz o Google.

O Gemini 1.0 também se beneficia de uma capacidade de raciocínio aprimorada que lhe permite interpretar dados e encontrá-los em grandes volumes de informações.

A introdução desta tecnologia permite aos utilizadores examinar rapidamente grandes quantidades de informação e destilar conhecimentos pertinentes, o que tem o potencial de transformar uma vasta gama de disciplinas que vão desde a investigação científica à análise financeira. Além disso, possui a capacidade de compreender conceitos complexos e fornecer respostas perspicazes relacionadas a assuntos avançados, como teorias matemáticas ou físicas. Em essência, pode servir como uma ajuda inestimável para decifrar problemas complexos e desvendar os seus princípios subjacentes.

Além de interpretar texto e imagens estáticas ou em movimento, o Gemini também deve ajudar os desenvolvedores ao ser capaz de gerar código de “qualidade” em diferentes linguagens (Python, Java, C\+\+, Ir…).

Gemini também serve de base para o novo sistema de geração de código AlphaCode 2 para programação de alto nível.

Gemini foi treinado nos componentes TPU v4 e v5e (Tensor Processing Unit), aceleradores especializados projetados diretamente pelo Google e que também estão no centro de outros serviços da gigante californiana que está aproveitando a oportunidade para anunciar um sistema Cloud TPU v5p projetado especificamente para treinar grandes modelos de IA.

/images/google-cloud-tpu-v5p_0ae1052701693447.jpg

Onde certas inteligências artificiais tendem a se desviar e oferecer conteúdo tóxico, a Gemini quer ser muito mais confiável e controlada, com diferentes testes realizados em cada etapa de seu treinamento para garantir que a IA não ultrapasse seu escopo e não poderia ser induzido a oferecer conteúdo problemático. Só a utilização em larga escala dirá se as barreiras existentes são suficientes.

APIs Gemini de acesso gratuito

Qual será a disponibilidade? O Google indica que o Gemini Pro agora está disponível através do Bard em seus serviços on-line, o que constituirá “a maior melhoria do Bard desde o lançamento”, refinando suas habilidades de compreender, raciocinar, sugerir, planejar e escrever.

Bard infused by Gemini estará disponível primeiro em inglês em 170 países antes de ser oferecido em outros idiomas nos próximos meses. Tal como acontece com Bard inicialmente, você provavelmente terá que esperar um pouco antes de se beneficiar de uma equivalência em francês.

A versão incorporada Gemini Nano primeiro encontrará lugar no **** (como parte do Pixel Feature Drops de dezembro) com suporte para uma função"resumir"no aplicativo Recorder e a geração de respostas automáticas com o GBoard teclado virtual, primeiro no WhatsApp e logo em outros aplicativos.

O Google anunciou recentemente que está testando a integração do Gemini em sua plataforma de mecanismo de busca para aprimorar a experiência geral do usuário, fornecendo uma navegação contínua e fácil pelas páginas da web.

Para desenvolvedores, o acesso ao Gemini Pro passará por uma API Gemini utilizável no ambiente Gemini AI Studio. Para Android e Gemini Nano, você terá que passar por AICore e Android 14, mas teremos que esperar por smartphones compatíveis, além do Pixel 8 Pro.

Gemini Ultra, a versão mais poderosa da IA, atualmente permanece em fase de testes e ajustes, mas deve ser oferecida a desenvolvedores e empresas no início do próximo ano, o que também dará a oportunidade de lançar o Bard Advanced aproveitando dos recursos mais avançados do modelo de IA do Google.

Fonte: Google Blog Jornalista deste site especializado em mobilidade/Ante-Geek das profundezas da Web e de outros lugares

*️⃣ Link da fonte:

Google Blog ,