Contents

Foi realmente bom demais para ser verdade?

Num esforço para demonstrar as capacidades do seu mais recente Large Language Model (LLM), conhecido como Gemini, o Google disponibilizou um vídeo promocional destacando o seu desempenho. No entanto, por uma questão de apresentação, certos elementos foram manipulados artificialmente durante a filmagem para criar a ilusão de que a interação entre os utilizadores e o sistema de IA se assemelhava muito ao que foi retratado no vídeo.

/images/google-demo-gemini-1200x675.jpeg Fonte: Google

Recentemente, o Google lançou um cartão alimentado por IA chamado Gemini, que representa seu modelo de linguagem mais avançado (LLM) projetado para exceder as capacidades do GPT da OpenAI. Como prova da sua superioridade, o Google apresentou algumas estatísticas; no entanto, foi um vídeo promocional que realmente chamou a atenção dos telespectadores. Lamentavelmente, a autenticidade do referido vídeo foi examinada e o Google reconheceu que ele havia sido manipulado. Embora aceitasse a responsabilidade pelo engano, a admissão veio tardiamente.

Um vídeo de Gêmeos bom demais para ser real

Em conjunto com o lançamento do Gemini, o Google lançou um tutorial introdutório apresentando suas capacidades como inteligência artificial multimodal capaz de processar entradas em diversas formas, como texto, imagens e vídeos. Notavelmente, a demonstração utiliza Gemini Ultra, a iteração de ponta do modelo de linguagem, embora o Google ainda não tenha reconhecido este facto. A omissão estratégica da empresa serve para criar a impressão de que em breve o público terá acesso a esta mesma versão da tecnologia.

Gemini demonstra suas capacidades notáveis ​​ao identificar e descrever com precisão um pato desenhado lentamente em vários idiomas em um breve período de tempo. A capacidade da IA ​​de participar de várias atividades, como jogar pedras, papéis e tesouras, bonneteau e realizar truques de mágica, destaca ainda mais sua versatilidade. Além disso, Gemini mostra seu talento para criar representações visuais usando fios de lã, enfatizando seu conjunto diversificado de habilidades.

/images/hands-on-with-gemini-interacting-with-multimodal-ai-1-10-screenshot-1200x675.jpg Fonte: Google

O desenvolvimento de tecnologia avançada de inteligência artificial pelo Google não é sem precedentes. Em 2018, o Google introduziu o Google Duplex como meio de conduzir interações baseadas em voz por meio da plataforma Google Assistant. O sistema parecia altamente capaz de lidar de forma autônoma com tarefas como agendamento de compromissos, sem exigir qualquer intervenção do usuário além de iniciar a conversa. No entanto, apesar da demonstração impressionante, a funcionalidade não conseguiu ganhar força em aplicações do mundo real cinco anos depois. Além disso, foram relatados casos em que o sistema contactou erroneamente operadores humanos, em vez de confiar nas suas capacidades de IA.

Pequenas dicas do Google para mostrar sua IA da melhor maneira possível

A fantasia de ter constantemente um assistente pessoal como Jarvis do Homem de Ferro ou HAL 9000 ao seu lado diminuiu temporariamente, como evidenciado pela isenção de responsabilidade na descrição do vídeo que afirma “Para efeitos desta demonstração, a latência foi minimizada e a saída gerada por Gêmeos foi abreviado para concisão.” Isto sugere que a verdadeira capacidade de resposta da tecnologia permanece incerta. No entanto, parece que o ChatGPT Voice ainda poderá revelar-se uma ajuda de comunicação eficaz num futuro próximo.

/images/hands-on-with-gemini-interacting-with-multimodal-ai-4-0-screenshot-1200x675.jpg

Ao explorar o site do Google Developers, fica evidente que a comunicação entre o indivíduo no vídeo e Gemini foi conduzida principalmente por meio de texto escrito e não de fala verbal. Além disso, o sistema de IA não percebeu os objetos representados nas imagens apresentadas em tempo real; em vez disso, baseou-se em imagens pré-existentes como meio de compreender o seu ambiente.

/images/gemini-demonstration-truquee.jpeg As instruções dadas ao Gemini na demonstração//Fonte: este site

Através de diversas demonstrações, observou-se que os LLMs podem ser manipulados para fornecer respostas mais precisas e personalizadas. Para isso, é importante apresentar as questões com o máximo de detalhes possível para que o LLM possa gerar uma resposta mais específica. Por exemplo, ao mostrar uma imagem de pedra, papel e tesoura, fazendo perguntas detalhadas sobre cada objeto características, o LLM foi capaz de produzir uma resposta mais informada e matizada. Da mesma forma, ao pedir ao Gemini que determinasse o carro mais aerodinâmico com base em detalhes visuais específicos, como o formato do veículo, o LLM conseguiu fornecer uma resposta mais precisa. No geral, fornecer informações detalhadas e focar em aspectos específicos de um problema permite maior controle sobre a saída gerada pelos LLMs

Gemini vs GPT-4: capacidades (quase) semelhantes

Tendo em conta a exposição convincente, pode-se inferir que o Google alcançou a paridade com o GPT-4 da OpenAI e o seu próprio projeto, Gemini. No entanto, deve-se notar que existem especulações sobre a possibilidade de o Google desenvolver o GPT-5 além dos anúncios públicos. Além disso, em muitas avaliações, o desempenho do Gemini supera o GPT por uma margem relativamente modesta.

/images/comparaison-performances-google-gemini-vs-gpt-4-1200x1343.jpg Gemini supera GPT-4 em texto…//Fonte: Google

O benefício da demonstração do Gemini Ultra reside na capacidade de ser replicado usando GPT-4 e ChatGPT Plus, o que requer uma assinatura paga do ChatGPT. Isso foi demonstrado em um experimento conduzido pelo professor Ethan Mollick da Wharton, conforme relatado pela Bloomberg. Embora a IA do Google possa parecer mais adepta à compreensão das intenções, a capacidade do ChatGPT de processar informações visuais produz respostas comparáveis ​​às do Gemini quando fornecidas com imagens apropriadas. De acordo com o Prof.

Lamentavelmente, parece que a Google pode ter comprometido a sua reputação ao tentar gabar-se de uma das suas inovações. O infeliz padrão de promessas excessivas e entregas insuficientes continua para o gigante tecnológico, apesar do facto de a demonstração ainda ser uma demonstração notável das suas capacidades.

*️⃣ Link da fonte:

Site do Google para desenvolvedores , Bloomberg , em,