Contents

Uma atualização revolucionária para agentes inteligentes

Claude, nosso inovador sistema de inteligência artificial, possui um compromisso com a honestidade, utilidade e segurança. Com a introdução do nosso modelo de linguagem de ponta, agora disponível em três iterações distintas, fizemos avanços significativos no sentido de avançar os limites da IA ​​generativa. Nossas capacidades superam até mesmo as dos antecessores mais sofisticados, incluindo o ChatGPT.

A procura da inteligência artificial continua vigorosa, com empresas ainda mais pequenas a trabalhar no desenvolvimento de grandes modelos de linguagem a registar progressos notáveis. Um exemplo é a startup francesa Mistral AI, que lançou recentemente o Le Chat, um chatbot desenvolvido pela Mistral Large que serve como um formidável concorrente ao ChatGPT da OpenAI (como evidenciado pela nossa cobertura anterior). Além disso, a empresa americana Anthropic, fundada por ex-colaboradores da OpenAI, lançou seu mais recente modelo de linguagem importante, Claude 3, em uma postagem recente no blog. Embora alegue superioridade ética sobre os modelos GPT-4 da OpenAI e Gemini 1.0 do Google, procura superá-los em vários testes multimodais.

Claude 3: o que muda em relação à versão anterior?

Claude 3 representa um avanço do modelo de linguagem Claude, aderindo aos mesmos princípios fundamentais exibidos pelo ChatGPT. Para obter uma resposta da inteligência artificial, os usuários são obrigados a inserir suas dúvidas por meio de uma interface amigável. A Anthropic revelou três iterações distintas da série Claude 3, incluindo variações inspiradas em haicais, sonetos e opus.

O modelo Opus possui recursos impressionantes, incluindo análise e previsão avançadas, criação sofisticada de conteúdo, geração eficiente de código e proficiência em vários idiomas, como espanhol, japonês e francês. Além disso, possui a capacidade de resolver problemas matemáticos complexos, raciocinar de forma eficaz e exibir compreensão e destreza quase humanas ao lidar com tarefas complexas. Este nível excepcional de desempenho coloca o modelo Opus entre o auge dos modelos de IA, aproximando-se mais de alcançar inteligência artificial com ampla aplicabilidade. Além disso, o modelo Opus demonstrou resultados superiores em comparação com o seu antecessor, GPT-4, em várias métricas de avaliação críticas utilizadas pelos padrões da indústria. Em termos de aplicações práticas, a Anthropic apregoa tempos de resposta rápidos para diversas funcionalidades, como real

Além disso, os sistemas avançados de inteligência artificial evoluíram para abranger múltiplas modalidades, permitindo-lhes lidar com uma extensa gama de representações visuais, como fotografias, dados tabulares, ilustrações gráficas e esquemas especializados. No entanto, estes sistemas continuam incapazes de produzir imagens por si próprios.

Claude 3 Opus: o mais poderoso dos grandes modelos de linguagem

A Anthropic desenvolveu uma versão avançada de seu modelo de linguagem de IA conhecido como Claude 3 Opus, que apresenta eficiência excepcional no tratamento de uma ampla gama de tarefas, incluindo aquelas que são particularmente desafiadoras. Segundo a empresa, esta tecnologia inovadora possui a capacidade de responder eficazmente a dúvidas abertas e situações imprevistas com notável adaptabilidade e um nível de compreensão que se assemelha muito aos processos de pensamento humano. Em essência, Claude 3 Opus serve como um testemunho dos limites potenciais da inteligência artificial generativa.

A Opus se destaca em comparação com seus pares em várias métricas de avaliação comumente utilizadas para sistemas de inteligência artificial, como MMLU, um indicador de compreensão especializada de graduação, registrando uma pontuação impressionante de 86,8%, contra 86,4% para GPT-4 e 83,7% para Gemini 1.0. Ultra. Além disso, teve um desempenho excepcionalmente bom em matemática básica, alcançando a marca de 95%, superando o GPT-4 com 92% e o Gemini 1.0 Ultra com 94,4%. Notavelmente, a disparidade de desempenho se estende a certas tarefas especializadas, incluindo HumanEval, onde o Opus obteve uma pontuação notável de 84,9%, excedendo significativamente o GPT-

/images/39490463.jpeg © Antrópico

Para avaliar o desempenho de vários modelos de inteligência artificial, empregamos uma métrica conhecida como tokens, que nos permite avaliar a profundidade do processamento e a capacidade de memória. A contagem de tokens de Claude 3 Opus é de 200.000, permitindo aproximadamente 150.000 palavras no texto fornecido. Em contraste, o Anthropic possui um limite impressionante de tokens de mais de um milhão, superando até mesmo o dos 128.000 tokens do Gemini 1.5. Conseqüentemente, o Anthropic é adequado para automatizar tarefas como integração de API e gerenciamento de banco de dados, programação interativa e realização de revisões de pesquisas, geração de hipóteses, descoberta de medicamentos, análise de dados financeiros e realização de previsões com base em gráficos e padrões históricos.

Claude 3 Soneto e Haiku: modelos mais acessíveis

A Anthropic revelou dois modelos adicionais de Claudette 3, chamados Sonnet e Haiku, cada um ostentando uma enorme capacidade de vocabulário de 200.000 tokens. Ambos os modelos incorporam uma combinação ideal de capacidade intelectual e rapidez, atendendo particularmente às diversas necessidades das empresas. O Sonnet apresenta durabilidade excepcional sob ampla implantação de IA, oferecendo desempenho confiável a um preço competitivo em comparação com seus equivalentes. Este modelo versátil acomoda uma ampla gama de aplicações, como processamento de dados, vendas, geração de código, garantia de qualidade, análise de texto baseada em imagens e muito mais.

/images/39490465.jpeg © Antrópico

Por seu lado, o Haiku apresenta-se como o modelo mais rápido e compacto, com capacidade de resposta quase instantânea. “Ele responde a dúvidas e solicitações simples com velocidade incomparável. Os usuários poderão criar experiências de IA perfeitas que imitam as interações humanas”, explica a Anthropic. Pode ser utilizado principalmente para moderação de conteúdo (detecção de comportamentos de risco ou solicitações de clientes) e tarefas econômicas (logística otimizada, gestão de estoques, extração de informações de dados não estruturados).

Claude 3: onde podemos testá-los?

Claude apresenta uma qualidade distinta como inteligência artificial “ética”, distinguindo-se do seu antecessor, Claude 2. Ao contrário de Claude 2, Claude Opus, Sonnet e Haiku apresentam uma menor propensão a recusar a capacidade de resposta quando encontram limites estabelecidos pelas diretrizes do sistema. Por outro lado, os modelos de Claude 3 demonstram uma compreensão mais refinada das indagações, discernem danos reais e rejeitam sugestões benignas com maior raridade.

/images/39490464.jpeg © Antrópico

Opus, um modelo de linguagem desenvolvido pela Anthropic, passou por um engano inteligente orquestrado por seu engenheiro imediato, Alex Albert. Como parte de um experimento destinado a localizar uma “agulha em um palheiro”, Albert inseriu uma frase aparentemente irrelevante sobre coberturas de pizza em um documento não relacionado ao assunto. Ele então fez uma pergunta que só poderia ser resolvida por meio do conhecimento obtido na frase oculta. Notavelmente, a Opus identificou a declaração anómala e presumiu que esta tinha sido introduzida com o propósito de testar a sua atenção e não com qualquer conteúdo pertinente no texto. Curiosamente, as informações sobre coberturas de pizza pareciam estranhas ao material circundante, o que não proporcionava nenhuma visão adicional sobre o assunto.

O Claude 3 foi projetado pensando nos usuários profissionais devido à sua capacidade de seguir “diretivas intricadas e multifacetadas” e aderir ao tom e protocolos de conversa específicos de uma marca, resultando em interações com o cliente que exibem confiabilidade. Ambas as iterações Sonnet e Opus de Claude 3 estão atualmente disponíveis através do chatbot Claude AI e dos serviços API Antrópicos em 159 países, excluindo a França. Embora o Sonnet possa ser acessado gratuitamente utilizando o Claude, o Opus é exclusivo para quem assina os planos Claude Pro. Além disso, o Haiku estará disponível em breve.

*️⃣ Link da fonte:

uma postagem no blog ,