Conheça seu novo rei da IA!

2024-04-01 590 words 3 minutes

Contents

Se perguntássemos a qualquer usuário médio qual é o melhor modelo de IA (pelo menos, IA de geração de texto) a maioria das pessoas responderia"ChatGPT". Afinal, tem sido assim desde o seu lançamento, apesar da crescente concorrência. E, no entanto, embora ainda sem fazer muito barulho, o status quo da IA parece estar a mudar.

Há quase um mês repercutimos o lançamento do modelo de linguagem Claude 3 , desenvolvido pela Anthropic, e que chegou ao mercado apontando caminhos… tanto que foi lançado superando o GPT-4 em diversos testes que mediu todos os tipos de habilidades.

Mais tarde, descobriu-se que Claude 3 exibia um nível de inteligência comparável ao dos humanos, com alguns especialistas até sugerindo que ele possuía autoconsciência em nível igual ou superior.

Chatbot Arena falou

Agora, o prestigiado ranking Chatbot Arena (que avalia, como o próprio nome sugere, as IAs utilizadas como ‘cérebros’ dos chatbots) se pronunciou. E a conclusão é que GPT-4 não é mais o rei da categoria: viva Claude 3!

A Large Model Systems Organization, ou LMSYS ORG, em parceria com conceituadas instituições acadêmicas, lançou o projeto inovador conhecido como Chatbot Arena, que serve como referência para a avaliação imparcial de modelos de linguagem avançados em grande escala.

Graças a um método interativo que permite aos usuários votar no modelo que melhor responde às suas dúvidas ou tarefas (você também pode participar, aliás), este projeto oferece uma plataforma única que destaca tanto os aspectos técnicos quanto as impressões subjetivas que os usuários percebem ao interagir com essas IAs.

Neste site o criador do ChatGPT volta a falar sobre os perigos da IA que o mantiveram acordado a noite toda e dá pistas sobre o GPT-5

Assim, os votos de 400.000 usuários moldaram um ranking liderado por Claude, um modelo que não só conseguiu se destacar em termos de desempenho técnico, mas também conquistou a preferência dos usuários graças à sua capacidade de “entender” e responder de forma mais coerente e útil, aspecto que, embora menos tangível, é crucial para o sucesso junto do público…

…se um usuário tiver a ‘sensação’de que Claude fornece respostas mais úteis do que ChatGPT, isso será a única coisa que realmente importa , independentemente das conclusões de qualquer tipo de testes e artigos.

Mas OpenAI ainda não disse sua última palavra

A ascensão de Claude 3 ao topo representa não apenas uma vitória para a Anthropic, mas também um avanço significativo para todo o setor, que prova não estar condenado a ‘seguir’OpenAI, mas tem capacidade competitiva. Isto é algo muito relevante num momento em que a OpenAI acaba de apresentar duas IAs que ameaçam levar a sua capacidade de monopólio também à geração de vídeo e síntese de voz.

Por outro lado, não podemos esquecer que o GPT-4 está ativo há um ano, com todo o mérito que isso acarreta… e que o lançamento do GPT-5 parece ser algo cada vez menos distante. Tanto é que No final de março, alguns clientes corporativos da OpenAI já teriam recebido algumas amostras do GPT-5 e versões melhoradas do ChatGPT baseadas neste modelo… e as mesmas fontes indicam que neste verão teremos o modelo sobre a mesa.

Imagem | Marcos Merino por meio de IA

A Amazon fez recentemente um investimento substancial de quatro mil milhões de dólares na Anthropic, numa tentativa de enfrentar os desafios colocados pelos avanços na inteligência artificial. Este desenvolvimento marca o início de uma luta contínua para a obtenção de capacidades superiores de IA.

*️⃣ Link da fonte:

, você também pode participar ,