Contents

Conheça Gemini-Superando o GPT-4 aos trancos e barrancos!

/images/6921220abbf3f44af55714b86a5780bed798145b80b6bc62588e6db1e69cddeb.jpg Sundar Pichai apresenta Gêmeos © Google

O Google está desferindo um grande golpe na indústria de IA e aprendizado de máquina com o Gemini, um modelo de linguagem multimodal que promete superar o GPT-4.

Na Conferência I/O do Google em maio passado, a gigante da tecnologia revelou o Gemini, um modelo de linguagem avançado que supera as capacidades do PaLM, sobre o qual os seus produtos existentes são construídos. Hoje marca o lançamento oficial do Gemini e o Google expressa grande otimismo em relação à sua eficácia.

Gemini mais eficiente que GPT-4?

A realização do projeto Gemini tem uma importância significativa para o avanço da inteligência artificial, conforme percebido por Demis Hassabis, CEO do Google DeepMind. A equipe enfrentou o desafio de criar um modelo de linguagem de IA que excedesse as capacidades do GPT-4, que foi desenvolvido pela OpenAI e utilizado pela Microsoft em suas ofertas de produtos.

O Google não se esquivou de comparar seu próprio modelo de linguagem, Gemini, ao GPT-4, numa tentativa de mostrar sua superioridade. Conforme afirmado por Demis Hassabis, uma figura importante do Google, ambos os modelos passaram por uma série de 32 testes de benchmark, com o Google saindo vitorioso em quase todos os casos.

Nossa equipe demonstrou superioridade sobre o produto do nosso concorrente em 30 dos 32 fatores avaliados, conforme afirma o líder da DeepMind conforme relatado pelo The Verge. Embora as diferenças de desempenho entre nós e o nosso rival sejam geralmente muito pequenas, destacamo-nos particularmente na compreensão e resposta a conteúdos multimédia, tais como gravações de áudio e vídeo.

O objetivo do Google com a Gemini era desenvolver um modelo de linguagem genuinamente multimodal que diferisse das abordagens de outras empresas de IA, como a OpenAI, que dependem principalmente de entradas visuais por meio de imagens ou entradas auditivas via Whisper. Este último requer a interface de múltiplas plataformas para alcançar uma experiência de usuário abrangente, o que pode apresentar desafios na otimização do desempenho.

Um modelo que integra nativamente imagem e áudio

Na verdade, a eficiência do Gemini é motivo de orgulho para o Google. Não só ultrapassa o PaLM em termos de velocidade, mas também requer menos recursos para operar. Isto se torna ainda mais significativo considerando o investimento substancial necessário para manter a infraestrutura necessária para que as tecnologias baseadas em aprendizado de máquina tenham um desempenho ideal.

O Google atualizou recentemente seu sistema TPU para a versão v5p, que permite treinamento e execução eficientes de modelos de aprendizado de máquina em larga escala em data centers. Além disso, a Gemini utilizou unidades de processamento Tensor internas, resultando em despesas reduzidas, em vez de depender de equipamentos NVIDIA mais caros.

Sundar Pichai expressa sua satisfação com a vasta gama de melhorias introduzidas pelo Gemini, que melhoraram significativamente seu desempenho em inúmeras aplicações de modelos de linguagem em larga escala. Notavelmente, ele destaca o impressionante avanço na geração automatizada de código, como evidenciado pelos resultados do AlphaCode 2, onde ultrapassou 85% dos participantes na avaliação de codificação de um desenvolvedor, representando uma melhoria em relação à sua iteração inicial, quando alcançou uma pontuação de 50%.

Gemini no Bard e Pixel 8 Pro agora

Para facilitar a integração perfeita do Gemini em vários produtos do Google e garantir atualizações oportunas com os avanços mais recentes do modelo, o Google se concentrou na criação de uma versão versátil da tecnologia em múltiplas plataformas. O modelo vem em três iterações diferentes para compatibilidade ideal e aprimoramento contínuo.

-Gemini Nano: Mais leve, foi projetado para rodar de forma nativa, local e offline em dispositivos Android. -Gemini Pro: projetado para ser incorporado a vários serviços do Google, incluindo o chatbot Bard. -Gemini Ultra: mais poderoso, deve alimentar os data centers e atender às enormes necessidades das empresas.

Em relação ao cronograma de lançamento, foi declarado pelo Google que Bard implementará o Gemini imediatamente. Consequentemente, os proprietários de uma única instância experimentarão um fornecimento rápido de diversas novas funcionalidades resultantes da integração do Gemini Nano no devido tempo.

/images/b6a63389d8fae900d901dec5c810b46f143bf9b703e3f7af8cbdb408389f6d94.jpg Pixel 8 Pro © Nicolas Lafarge-Debeaupuis para este site

A partir de 13 de dezembro de 2023, tanto os desenvolvedores quanto as empresas terão a oportunidade de utilizar o Gemini Pro por meio do Generative AI Studio e do Vertex AI do Google, que estão integrados à plataforma Google Cloud. Embora se espere que o Gemini Ultra se torne acessível no ano seguinte, o Google optou por ter cautela, garantindo minuciosamente a robustez de uma versão específica do seu modelo que apresenta uma extensa gama de potencialidades.

A diversificada gama de ofertas do Google além do seu motor de busca, incluindo o seu navegador web e uma infinidade de ferramentas adicionais, deverá ser alimentada pela tecnologia inovadora por trás do Gemini num futuro próximo. Atualmente, o Gemini está limitado ao processamento de texto no idioma inglês; no entanto, expandir-se-á gradualmente para acomodar uma gama cada vez mais ampla de capacidades linguísticas.

A melhor IA para gerar seu conteúdo /images/800c9aad9b08929da7dce9ce087536b028f1caf7a7376ca8debda34866a568ce.jpg

O surgimento da inteligência artificial como ferramenta convencional abriu inúmeras possibilidades para todos os produtores de conteúdo. Texto, imagem, som… Esta nova tecnologia da moda pode agora prestar assistência em muitas áreas e facilitar o trabalho nas fases mais difíceis da criação. E com uma oferta cada vez maior, é importante distinguir quais ferramentas proporcionam um valor acrescentado real. Assim você não perde horas experimentando tudo o que as páginas de resultados do Google oferecem! Consulte Mais informação

Fonte: The Verge

*️⃣ Link da fonte:

The Verge,