Contents

A adulteração de demonstração do Google sai pela culatra

Foi sugerido que o Google pode ter deturpado as capacidades do Gemini, seu mais recente modelo de linguagem que, segundo eles, supera o GPT-4 da OpenAI em termos de inteligência. Embora atualmente não haja evidências que desacreditem as afirmações do Google, é evidente que a empresa pode ter errado na forma como retratou as características e habilidades do Gemini.

Em um vídeo de aproximadamente seis minutos e vinte e três segundos, amplamente divulgado em diversos meios de comunicação e plataformas sociais no dia 6 de dezembro de 2023, o Google revelou sua mais recente criação de inteligência artificial conhecida como Gemini. Este sistema avançado de IA foi apontado como possuindo capacidades semelhantes às de Jarvis do Homem de Ferro, ostentando uma capacidade impressionante de processar e compreender seu ambiente em tempo real. A demonstração contou com uma conversa entre o apresentador e Gêmeos, onde este último forneceu respostas lógicas baseadas em instruções verbais mínimas. Embora o desempenho apresentado pelo Gemini parecesse notável, é improvável que a IA funcionasse dessa forma em circunstâncias reais.

Chegou ao conhecimento de vários usuários da Internet que certas modificações foram feitas no vídeo de demonstração no site do Google, resultando em uma representação falsa das capacidades do Gemini. Embora estas alterações possam parecer insignificantes, podem potencialmente prejudicar a reputação da Google, criando falsas expectativas sobre o seu desempenho.

Gêmeos não pode comentar sobre o mundo em tempo real

No referido vídeo divulgado pelo Google, o tão aguardado modelo de linguagem Gemini Ultra é apresentado em sua encarnação multimodal, exibindo a capacidade não apenas de processar informações auditivas, mas também de perceber estímulos visuais em tempo real, gerando posteriormente respostas por meio de fala sintetizada. Esta tecnologia inovadora parece ter atingido o auge da inteligência artificial retratada em filmes populares de ficção científica, preparada para remodelar o curso da história humana. Além disso, o Google posiciona Gemini como um “parceiro” ou “aliado”, sugerindo uma relação mais colaborativa entre homem e máquina.

Na verdade, a natureza multimodal do Gemini Ultra não está relacionada com a demonstração fornecida pelo Google.

Em essência, o Gemini Ultra demonstrado durante o showcase compartilha semelhanças com o agente de conversação do Google, onde os usuários podem enviar solicitações textuais e visuais. Ao contrário do Google Bard, porém, todas as interações foram conduzidas por meio de comunicação escrita, em vez de consultas verbais. Além disso, o Gemini Ultra não exige visualização em tempo real dos materiais enviados; em vez disso, depende de imagens ou ilustrações preexistentes. Esta capacidade está alinhada com a experiência do ChatGPT, que é proficiente no tratamento de tais tarefas. Além disso, o Google afirma ter otimizado seu processo editorial, resultando em tempos de resposta mais rápidos. Deve-se notar que a elaboração de narrativas coerentes requer um certo tempo para o Gemini Ultra, ao contrário das vocalizações instantâneas. Por último,

Para facilitar uma apresentação perfeita, o Google fez ajustes no vídeo no YouTube, diminuindo a latência e abreviando as respostas do Gemini para maior concisão.

/images/capture-decran-2023-12-06-a-145105-1024x466.jpg Neste exemplo, o Google fingiu que Gemini estava comentando um desenho em tempo real. Na verdade, a cada desenvolvimento, ele mandava uma foto para ela.//Fonte: Google

De forma mais complexa, a questão em questão diz respeito ao facto de as consultas efetuadas pela Google terem sido adulteradas. Por exemplo, quando o Google questionou Gemini sobre “qual carro viaja mais rápido?” o que na verdade estava sendo postulado era “Levando em conta as propriedades aerodinâmicas de ambos os veículos, qual automóvel alcançaria maior velocidade entre aqueles posicionados nos lados esquerdo e direito? Forneça uma explicação detalhada fundamentando sua resposta.” Por meio dessa deixa, Gemini poderia fornecer uma resposta exaustiva que incorporasse aerodinâmica; no entanto, sua resposta não surgiu naturalmente.

Em outro caso, quando os humanos participam de um jogo envolvendo copos, como o tradicional “qual copo está segurando a bola?” exercício, meu amigo Gêmeos não consegue discernir os movimentos ou mudanças que ocorrem. Ele exige uma explicação por escrito esclarecendo que “a posição da xícara 1 substituiu a da xícara 2”. Da mesma forma, a disposição dos corpos celestes no nosso sistema solar pode parecer arbitrária e desordenada, mas após uma análise mais detalhada, devemos considerar as distâncias relativas entre cada objeto e o Sol ao avaliar a sua correta colocação. Em essência, o meu raciocínio vai além da mera observação e leva em conta os factores contextuais mais amplos em jogo.

/images/capture-decran-2023-12-08-a-094104-1024x903.jpg As respostas de Gêmeos são reais, mas as perguntas são falsas. O Google ajudou sua IA a parecer inteligente.//Fonte: Google

Em um post recente publicado em sua plataforma de engenharia, o Google fornece uma visão geral de consultas específicas enviadas ao Gemini. A gigante da tecnologia reconhece que a sua apresentação apresenta uma conversa baseada em texto acompanhada de elementos visuais. Essas perguntas são substancialmente mais extensas do que as retratadas no vídeo promocional, resultando em respostas de Gêmeos que parecem altamente perspicazes. É evidente que o objetivo principal por trás deste esforço era tornar obsoleta qualquer dependência remanescente de modelos anteriores de IA, como o ChatGPT, embora criando potencialmente um cenário que pode não refletir com precisão a realidade.

Em essência, atualmente, Gemini Ultra não é igual a Jarvis. Em vez disso, representa uma iteração avançada do Google Bard, apresentando capacidades excepcionais de compreensão visual.

Google envia a mensagem errada

Parece que algumas pessoas questionaram se Gêmeos possui ou não a inteligência que foi inicialmente elogiada. No entanto, ao examinar as suas capacidades, diria que tal especulação é injustificada. Na verdade, a proficiência demonstrada por Gemini sugere que o Google pode ter ultrapassado o OpenAI em termos de avanços de IA, apesar de passar por um período tumultuado em que parecia que o desenvolvedor por trás do ChatGPT os mantinha consistentemente alerta. Em última análise, o Gemini representa um salto significativo para o Google, com a capacidade de integrar a compreensão contextual nos diversos serviços oferecidos pela empresa.

Lamentavelmente, parece haver um descuido significativo na estratégia de comunicação do Google. Inicialmente, obtiveram aclamação global pelas suas realizações inovadoras; no entanto, mais recentemente, ficaram aquém das expectativas. A plataforma Gemini Ultra, apesar de apresentar capacidades promissoras, ainda não demonstrou a capacidade de executar tarefas novas com eficácia. Além disso, o seu desempenho permanece comparável ao de outros modelos de IA, como o ChatGPT, que emprega um módulo de visão que permite o reconhecimento de imagens. Embora o vídeo de demonstração possa transmitir uma impressão de funcionalidade avançada, incluindo a capacidade de monitorar transmissões ao vivo e facilitar conversas interativas com humanos em tempo real, esta noção é enganosa, dado que as limitações reais da tecnologia não estão totalmente representadas na apresentação.. Consequentemente, é

O recurso ChatGPT Voice da OpenAI permite uma demonstração mais avançada de recursos de conversação em comparação com o que o Google oferece atualmente. A capacidade de fazer com que as respostas do ChatGPT sejam lidas em voz alta por uma voz sintética cria a ilusão de que a IA pode se comunicar efetivamente por meio da fala. Embora seja possível para o Google atingir esse nível de funcionalidade no futuro, a iteração atual do Gemini não é capaz de oferecer tal experiência no momento. Parece enganoso sugerir o contrário.

O Google procura manter a sua vantagem competitiva no domínio da inteligência artificial generativa, posicionando-se como um concorrente formidável contra o OpenAI. No entanto, para solidificar a sua posição, a empresa deve desenvolver aplicações práticas para estas tecnologias que sejam ao mesmo tempo apelativas e relevantes para os utilizadores. Um exemplo poderia envolver a integração de uma versão simplificada do Gemini em seus populares smartphones Pixel, utilizando recursos de processamento no dispositivo para melhorar o desempenho e, ao mesmo tempo, preservar a privacidade. A OpenAI já estabeleceu uma posição forte nesse sentido, deixando o Google tentar recuperar o atraso.

Descubra este site\+ da cache 1 12968/post_tag

*️⃣ Link da fonte:

Google , Em uma postagem de blog publicada em seu site de desenvolvedor,