Contents

Descobrindo a coleta de dados para treinamento em IA

Contents

A Autoridade Italiana de Protecção de Dados, responsável pela salvaguarda de informações pessoais, iniciou um inquérito destinado a averiguar se estão a ser implementadas medidas de segurança adequadas em plataformas online públicas e privadas para impedir a recolha não autorizada de dados para efeitos de formação de sistemas de IA por entidades externas.

Como se sabe, o treinamento de modelos de inteligência artificial generativa é realizado levando em consideração, entre outras coisas, dados públicos coletados na web. A investigação de apuramento de factos diz respeito a todas as entidades públicas e privadas, que operam como responsáveis ​​pelo tratamento de dados, estabelecidas em Itália ou que oferecem serviços em Itália, que tornam os dados pessoais livremente acessíveis em linha também pelas “aranhas” dos produtores de algoritmos de inteligência artificial.

De acordo com o relatório do fiador, inúmeras plataformas de inteligência artificial são reconhecidas pela sua capacidade de recolher grandes quantidades de informações, tanto pessoais como não pessoais, de diversas fontes, como websites públicos e privados, para uma série de fins pretendidos, incluindo divulgação de notícias e melhorar a transparência administrativa.

O Fiador estende um convite cordial a todos aqueles que são apaixonados por este tópico, incluindo organizações comerciais, grupos de consumidores, profissionais da academia, para compartilharem suas idéias e percepções sobre os protocolos de segurança implementados e aqueles que poderiam ser potencialmente empregados para proteger a privacidade dos indivíduos. durante o processo de desenvolvimento do algoritmo.

Observe que quaisquer comunicações relacionadas a este assunto poderão ser enviadas eletronicamente para nosso endereço de e-mail designado, a qualquer momento durante um período de sessenta dias após a publicação do anúncio de consulta pública em nosso site oficial. Além disso, é importante compreender que, após a conclusão do nosso processo investigativo, reservamo-nos a prerrogativa de implementar quaisquer ações corretivas consideradas apropriadas, incluindo aquelas exigidas por circunstâncias exigentes.

Um método para impedir o web scraping envolve a utilização do arquivo robots.txt para negar acesso aos rastreadores; no entanto, um número limitado de empresas oferece esta funcionalidade. A título de ilustração, ao empregar o ChatGPT, é crucial incorporar referências ao GPTBot, uma ferramenta de webcrawling criada pela OpenAI, para que o primeiro possa examinar o conteúdo da Internet e melhorar as capacidades linguísticas dos modelos de redes neurais artificiais através da análise.

Esta página fornece acesso a todas as notícias relacionadas à Inteligência Artificial, que podem ser encontradas em nosso site.

*️⃣ Link da fonte:

Eles ,