Contents

Testes de IA revelam inteligência inferior à dos humanos, quebrando expectativas

,

Há uma semana, repetimos o lançamento do AI ‘Claude-3’ pela Anthropic (fundada por ex-engenheiros da OpenAI) e como ela prometia alcançar o que parecia impossível: ser superior ao GPT-4 em muitos testes. Então descobrimos que uma reação inesperada desse modelo de IA havia surpreendido tanto seus desenvolvedores (e usuários da rede) que havia gente colocando em cima da mesa a possibilidade de estarmos presenciando os primeiros sinais de autoconsciência.

Isso, é claro, teria colocado Claude-3 no mesmo nível dos seres humanos, em teoria, as únicas entidades até agora dotadas dessa qualidade (embora se fale cada vez mais em"convidar grandes macacos, corvos ou golfinhos para esse clube'). Por outro lado, muitos especialistas afirmam que “simular a autoconsciência” é o que um chatbot que reproduz bem a nossa linguagem escrita deveria fazer, mas Isso significa apenas que a IA é boa em imitar..

Uma olhada em… ZAO, o APP MÓVEL chinês que através do DEEPFAKE transforma você em DICAPRIO em SEGUNDOS

Do que falamos quando falamos de IC

Agora, há quem fale que Claude-3 poderia já não ter igualado, mas superado, o humano médio …num critério tão relevante como o da inteligência, ao ultrapassar a barreira dos 100 no QI índice pela primeira vez. Mas, antes de nos aprofundarmos nisso, vamos esclarecer o que queremos dizer com ‘inteligência’? E ci'.

/images/fa8389aac35aa67d320182ee13bbc204fdd639a71953eb68aeabae6db2a32189.jpg Neste site Com o GPT-4 temos uma bomba nuclear nas mãos. Em 2019, a OpenAI não permitiu o acesso ao seu ancestral porque era “muito perigoso”

O QI é a medida que geralmente usamos para avaliar as habilidades cognitivas (não apenas a ‘inteligência’, mas também a memória, o raciocínio lógico, a compreensão verbal…) de uma pessoa em relação à população em geral. Hoje, é medido através de testes concebidos para serem, tanto quanto possível, independentes do contexto educacional, cultural e socioeconómico do indivíduo.

Por definição, o teste de QI sempre mostra"100"como média (eu faria isso mesmo se todos nos tornássemos superinteligentes) e é normal que a maioria das pessoas obtenha pontuações de 15 pontos acima ou abaixo dessa média (85-115).

Eles nos venceram em nosso território, pessoal.

/images/c0ef7f4d3485ca3247bc68a234214007cdd6aa3a78c91e7bd6b7744cce6fe755.jpg (Imagem: Fox Corp.)

Maxim Lott, um especialista em matemática e economia que escreve sobre IA em seu boletim informativo quando não está trabalhando como produtor de televisão, decidiu fazer e publicar um experimento que mostrasse como os modelos de IA falharam miseravelmente quando questionados sobre medição de QI com base visual. mas uma semana depois ele o reformulou para’traduzir’tais questões em testes baseados em texto (semelhantes aos que seriam feitos para pessoas com deficiência visual).

Para sua surpresa, com essa pequena mudança, o GPT-4 ficou localizado (quase) no limite inferior da faixa mencionada (85)… enquanto o recentemente lançado Claude-3 superou (também por um fio de cabelo) essa média para colocar si mesmo em 101 (e, aliás, lidera a classificação AI). Aqui você tem a classificação completa:

/images/27aa310a7ce36f6b92b4f4ac24eb8d8aca7fd28ceae97e2d4aa7db1a2c26eaac.jpg

Claude-3 agradavelmente surpreendeu, não apenas por superar o QI humano médio, mas também por mostrar uma progressão consistente através de suas diferentes versões: enquanto o primitivo Claude-1 mal superou alguém respondendo a perguntas aleatórias (você sabe, até mesmo um quebrado o relógio acerta duas vezes por dia), seus sucessores Claude-2 e Claude-3 mostraram melhorias incrementais que sugerem uma evolução calculada e promissora em suas habilidades cognitivas.

“Vamos agora considerar as datas de lançamento das versões: Claude-1º de março de 2023 Claude-2 de julho de 2023 (4 meses de produção) Claude-3 de março de 2024 (8 meses de produção)”.

De acordo com Lott, de facto, a extrapolação dos dados sugere que podemos ver IA com QI em torno de 120 num futuro próximo e, eventualmente, modelos ainda mais avançados capazes de superar praticamente qualquer ser humano em inteligência.

É claro que avaliar IAs com testes de QI levanta as mesmas questões que o debate sobre autoconsciência: quais aspectos da inteligência esses testes realmente medem? As pontuações obtidas por uma IA podem ser comparadas de forma confiável com aquelas alcançadas pelos humanos?

0

Em teoria, embora as IA tenham demonstrado capacidades impressionantes em tarefas específicas, tais como jogos de estratégia e reconhecimento de padrões, a sua “inteligência” difere significativamente da inteligência humana em termos de flexibilidade, generalização e compreensão contextual. Mas também é verdade que nunca tivemos uma ‘IA’ tão ‘inteligente’ até agora., e isso ainda é relevante.

1

Imagem | Marcos Merino por meio de IA

O tópico de discussão nesta plataforma gira em torno da importância da utilização de inteligência artificial de código aberto para evitar a ocorrência potencial de um evento hipotético conhecido como “Cenário SkyNet”, sobre o qual foram alertados por organizações como a OpenAI.

2

*️⃣ Link da fonte:

eles falharam miseravelmente, com aquela pequena mudança,