Contents

Resposta do hacker às demandas do governo

,

José Luis Escrivá, Ministro da Transformação Digital e Serviço Público, publicou um tweet na última segunda-feira explicando o projeto de seu governo para promover a criação de"um modelo de linguagem de IA em espanhol e línguas co-oficiais"porque os"modelos atuais, treinados em inglês, têm preconceitos quando se trata de serem usados ​​para a nossa realidade mais próxima".

A esse tweet ele respondeu ontem quinta-feira Jaime Gómez-Obregón, um’hacker da Administração Pública' cujos projetos abordamos em múltiplas ocasiões neste ambiente, em alguns casos defendendo a publicação aberta de contratos públicos pela administração da Cantábria , do País Basco ou do Tesouro Central, noutros casos denunciando erros graves nos sites da administração.

/images/cc029e36fe45c02433755354adf309eaa14c06330bfcb6fbf75e1e5b10be1e98.jpg Gómez-Obregón, na resposta em vídeo ao ministro.

Numa recente publicação em vídeo, Gomez-Obregon respondeu a um inquérito de Escrivá, começando com a seguinte declaração:

“Você e todos nós sabemos que qualquer esforço institucional para desenvolver um modelo público de inteligência artificial será, como sempre, um tiro na panela. Portanto, permita-me compartilhar com vocês como nós, técnicos e desenvolvedores, enfrentamos esse problema.”

Ao descrever o eventual investimento em modelos públicos de IA como uma “flor do dia”, você pode ter em mente antecedentes como investimentos fracassados ​​de câmaras municipais e conselhos em mercados públicos, versões locais da Amazon que (no papel) eles estavam indo para impulsionar as pequenas empresas e permitir-lhes enfrentar a Amazon pelo simples facto de terem um site online. E, invariavelmente, todos acabaram fracassando.

Mas os problemas desses sites de comércio eletrônico não podem ser muito semelhantes aos de um eventual modelo de linguagem… então Quais ‘falhas’ nosso hacker vê no projeto do governo?

“Veja, por um lado, estamos construindo software com lemas obsoletos, porque têm mais de 70 anos.“Este é o tempo que leva para os direitos autorais do Dicionário da Língua Espanhola e do resto do dicionários acadêmicos expirarão.”

“Este atual modelo de licenciamento está nos impedindo de reutilizar o conteúdo dos dicionários, e não apenas dos lemas, mas, claro, também das definições, das marcas lexicográficas e do restante dos dados e metadados. Alguns dicionários, aliás, que estão recebendo grandes quantias de dinheiro público”.

/images/b3be31cd848b78c2452adfc1c23d27bdcf25343ebec277d3699d02382d7a7f10.jpg Neste site “Os serviços públicos digitais são tão dolorosos” porque “cada região reinventa a roda”, explica o hacktivista Gómez-Obregón

Se Escribá fala do viés pró-anglo-saxão dos modelos de IA vigentes no mercado, Gómez-Obregón lembra que também do nosso lado estamos atirando pedras no nosso próprio telhado:

“E isto não é apenas uma questão de soberania nacional, como dizes, e partilho-o, mas é também, e sobretudo, um obstáculo que a cultura espanhola se impõe num mundo cada vez mais anglo-saxónico.”

Uma olhada em… Como solicitar o CERTIFICADO DIGITAL de PESSOA SINGULAR ao FNMT

“Os dados! Os dados! Os dados! Não consigo fazer tijolos sem argila!"(Sherlock Holmes)

Nosso protagonista também pede que não nos limitemos a desenvolver’modelos em espanhol', mas também"modelos verticais, treinados com conjuntos de dados específicos”.Mas há um problema, que **os dados com os quais poderíamos treiná-los não estão disponíveis ** para desenvolvedores:

“Como você diz, [estes modelos] exigem acesso a grandes bases de dados e grandes conjuntos de dados documentais, mas quem possui essas bases de dados? Bem, vocês mesmos os têm, o Estado os tem acima de tudo, mas não"Eles os compartilham. E é por isso que nós, desenvolvedores, não podemos usá-los ou construir ferramentas com eles."

“[…] Então, por favor, nos dê acesso aos dados. E construiremos os modelos e garanto que muitos serão gratuitos.”

“O Conselho Geral da Magistratura detém 8 milhões de decisões judiciais. Já estão digitalizados, anonimizados, não há objeção do ponto de vista do tratamento de dados pessoais. E, embora a Constituição diga que as decisões são públicas e a lei diga que estão isentas de propriedade intelectual, o Conselho não permite a reutilização gratuita. Porque? Porque eles estão vendendo “.

/images/befcd1f2ebc5ac1a6bbdbccc493ff04a5439a53503f8a225f53b5c9a19792f2e.jpg Neste site Este hacker passou os olhos lendo o BOE, então criou o SuperBOE para poder aplicar templates nele: ideal para oponentes

Considera que o Ministro da Transformação Digital Deveria falar com o seu colega da Justiça no próximo Conselho de Ministros sobre este tema… e sobre o Registo Comercial:

“Os dados da Conservatória do Registo Comercial são um tesouro público, mas não podem ser descarregados em massa. Porque um punhado de funcionários do Estado está mais uma vez lucrando com isso. Se esses dados fossem gratuitos, os técnicos, os desenvolvedores, poderiam construir ferramentas para dar mais transparência às compras públicas, promover maior concorrência nas licitações e detectar e destruir esquemas de corrupção.

Resumindo…

“Mas para isso precisamos de fontes de dados abertas para treinar modelos de inteligência artificial. E a capacidade de desbloquear tudo isso, o acesso a essas fontes de dados, Não depende de nenhuma entidade distante e abstrata, depende de você.”.

Imagem | Marcos Merino por meio de IA

Na tentativa de se comunicar com a Administração, o indivíduo em questão utilizou uma missiva manuscrita caracterizada pela linguística esotérica e selada com cera derretida.

*️⃣ Link da fonte:

ele respondeu ontem , investimentos fracassados ​​de câmaras municipais e conselhos em mercados públicos , lemmários obsoletos ,