Contents

Google explora chatbot com tecnologia de IA inspirado em LLMs e recursos visuais

/images/Project-Ellmann.jpg

Nos próximos anos, os i grandes modelos de linguagem (LLM) permitirão uma série de novos recursos em aplicativos que antes eram inimagináveis. Nesse sentido, o Google está pensando em explorar a inteligência artificial para criar uma visão panorâmica da vida dos usuários usando dados de telefones celulares, como fotos e pesquisas. De acordo com o que foi relatado pela CNBC, o Projeto Ellmann (inspirado no crítico literário Richard David Ellmann) usaria LLMs para ganhar consciência do que realmente está acontecendo em uma foto. O projeto usaria o LLM como Gemini para adquirir resultados de pesquisa, localizar padrões nas fotos de um usuário, criar um chatbot e “responder a perguntas anteriormente impossíveis” etc.: “já se passaram exatos 10 anos desde a formatura e a foto está cheia de rostos que não são vistos há 10 anos, então provavelmente é um reencontro”.

Projeto Ellmann: uma espécie de ChatGPT que sabe tudo sobre a vida dos usuários

Indo um passo adiante, aqui está um LLM que pode conhecer as preferências do usuário para um determinado tipo de comida (por exemplo, francesa) com base em imagens frequentes de determinados pratos (crepes e raclette). Além disso, captura de tela pode ser usada para determinar diferentes elementos , dar interesses , alho próximas compras , para programas de viagens e seus sites favoritos. O Google descobriu que os LLMs são ideais para este caso de uso. Em particular, o novo Gemini possui capacidades multimodais capazes de analisar imagens, vídeo, áudio e texto. A equipe do Google também apresentaria um chatbot chamado “ Ellmann Chat “, com a descrição: “Imagine abrir o ChatGPT mas ele já sabe tudo sobre a sua vida. O que você perguntaria a ele? ”. O chatbot é capaz de saber quando os familiares do usuário o visitaram pela última vez ou pode mostrar cidades semelhantes àquela onde ele mora atualmente como um possível destino para se mudar.

O projeto proposto por Ellmann pode ajudar os usuários a criar memórias de vida cada vez mais personalizadas. Na verdade, não se trata apenas de álbuns, como o Google Fotos (que, graças à IA, agora pode agrupar fotos semelhantes e organizar capturas de tela em álbuns fáceis de encontrar). O Projeto Ellmann será uma experiência real para o usuário. Porém, é preciso lembrar que, no momento, o projeto foi apresentado apenas durante um evento interno, que contou também com outras apresentações da equipe Gemini. Além disso, antes de poder ser liberado aos usuários, será necessário realizar vários testes. Conforme revelado por Mountain View na CNBC” Esta foi uma primeira exploração interna do Google Fotos e, como sempre, se decidirmos implementar novos recursos, dedicaremos algum tempo para garantir que sejam úteis para as pessoas e projetados para proteger privacidade e segurança do usuário como nossa maior prioridade”.

barra lateral inferior relacionada 300

*️⃣ Link da fonte:

CNBC,