Contents

A Meta usou livros piratas para treinar sua IA?

contém o conteúdo principal do bloco de texto da caixa de compartilhamento do cabeçalho da página

Em uma ação judicial que o coloca contra vários detentores de direitos, Meta admite ter treinado sua IA com partes de um banco de dados contendo livros piratas. A empresa nega ter violado os direitos dos autores em questão.

/images/Livres.jpg Créditos: 123RF

Falamos com você com frequência sobre inteligência artificial. A tecnologia deu um grande salto e a chegada do ChatGPT tornou-o acessível ao maior número de pessoas possível. Se você usa este chatbot ou outro de vez em quando, sabe que as respostas fornecidas são resultado de treinamento. Dos bilhões de dados foram transmitidos à IA para que aprendam o que dizer de acordo com o que lhes é pedido. O princípio é o mesmo seja qual for o objetivo desejado: detectar uma doença, ler mentes, gerar imagens…

E é precisamente este processo que hoje coloca cada vez mais problemas. Na grande maioria dos casos, os dados que permitem desenvolver inteligência artificial são recuperados da fonte mais abrangente disponível: Internet. Só que na Web encontramos textos e obras isentas de royalties certamente, mas também muitas outras protegidas por direitos autorais. Com o passar do tempo, as pessoas envolvidas multiplicam os ataques legais. É assim que a OpenAI, criadora do ChatGPT, se vê envolvida em intermináveis ​​processos judiciais. A controladora do Facebook, Meta, também está sujeita a diversas ações judiciais.

Meta é acusada de treinar sua IA com material protegido por direitos autorais

Para entender por que Meta é o alvo aqui, temos que voltar a 2020. Naquele ano, Shawn Presser , pesquisador de inteligência artificial cria o Book3. Este é um banco de dados que contém o conteúdo do site Bibliotik , então hospedado publicamente pelo coletivo The Eye. Dentro, 195.000 libras agrupadas em 37 GB de dados para fins de arquivamento. Com o Book3, o objetivo de Presser é oferecer dados para quem deseja desenvolver um modelo de IA. O problema é que na pilha existem livros protegidos , SO hackeados.

O Book3 permanece acessível por anos antes de desaparecer gradualmente sites onde o arquivo está hospedado. A pedido dos detentores de direitos, é claro. Antes disso, grandes nomes da tecnologia como Meta tinham muito tempo para utilizá-lo, e é disso que os demandantes acusam a empresa. O julgamento está em andamento, mas documentos mostram como o grupo de Mark Zuckerberg planeja se defender. Para começar, Meta admite usar o Livro3 para treinar sua IA.

IA da Meta pode ter recebido livros piratas para treinamento, empresa nega

Podemos ler: “Meta admite usar partes do conjunto de dados Books3, entre muitos outros materiais, para treinar Llama 1 e Llama 2”. São os seus modelos de linguagem, cuja 2ª iteração está disponível desde o verão de 2023. A questão agora é se isso constitui uma violação de direitos autorais. Por exemplo, os demandantes dizem que Mera deveria ter pedido permissão para usar suas obras. Mas “Meta nega que o uso de obras protegidas por direitos autorais para treinar Llama exija consentimento, crédito ou compensação”. E não adianta falar sobre pirataria já que “Meta nega ter violado os supostos direitos autorais dos demandantes”.

Para justificar o uso do Book3, Meta se esconde atrás da noção de “uso justo”, ou uso razoável, afirmando que “cópias não autorizadas de obras protegidas por direitos autorais […] constituem uso justo […]”. A tática é conhecida e amplamente utilizada nesse tipo de negócio ligado à inteligência artificial. Também se aplica a obras supostamente pirateadas, bem como àquelas publicadas em canais de acesso público, mas utilizadas sem permissão.

Este julgamento e outros estão apenas começando e muita coisa pode acontecer entre agora e uma decisão. Como último recurso, é a Suprema Corte americana que pode ser chamada a decidir. Qualquer que seja o veredicto final, ele terá um impacto significativo no desenvolvimento futuro da inteligência artificial.

Fonte: TorrentFreak

/end Classificação do TextBlock ********************NOTAS ** ** ** ** ** ** ** ** ** ** * **** ****************************** Classificação Julio Paginação/Paginação Julio Nextprev-post Artigo anterior seção seção Taboola da área de classificação

*️⃣ Link da fonte:

TorrentFreak ,