Contents

Liberte sua criatividade com estas 5 etapas simples para testar o conteúdo do seu site com IA!

,

Com a ascensão da inteligência artificial, foi colocado em cima da mesa o debate sobre a origem dos dados de treinamento de grandes modelos de linguagem — como o GPT-4 —… bem como o direito dos criadores dessas IAs de usar esses dados. Em alguns casos, chegou a ser colocado na mesa do tribunal.

Esses modelos são treinados usando grandes volumes de dados, incluindo conteúdo extraído de diversos sites. Esse processo, conhecido como “web scraping”, é uma prática comum em pesquisa, jornalismo e arquivamento digital. No entanto, alguns proprietários de websites podem ter reservas sobre a forma como o seu conteúdo é utilizado neste contexto específico.

Tanto a OpenAI quanto o Google emitiram diretrizes para proprietários de sites que desejam excluir o conteúdo de seus sites dos extensos conjuntos de dados de treinamento utilizados por tais modelos de inteligência artificial.

Uma olhada em… 11 SITES PARA BAIXAR EBOOKS GRATUITOS para o seu KINDLE este site TV

Protegendo nosso conteúdo

Graças a isso, podemos resumir os passos a seguir se você deseja excluir o seu site da ‘memória’ do ChatGPT e/ou de seus rivais. Ou melhor, exclua conteúdo futuro que você enviar para o seu site, uma vez que ambas as empresas não ofereceram (e provavelmente nunca oferecerão) um método para excluir os dados nos quais suas IAs já foram treinadas.

/images/b4e37af56276170c9da53283e09d9c1c21b274aa6c013f3ea3b485c63321fb3f.jpg Localização do arquivo robots.txt nos diretórios do servidor web, visualizado por meio de uma interface web.

Se você deseja evitar que o conteúdo do seu site seja usado em scraping futuro por qualquer um dos dois gigantes da IA, existe um processo simples, desde que sua hospedagem na web permita que você acesse a estrutura de arquivos do seu site, seja através da interface web do seu provedor de hospedagem ou através de um cliente FTP.

Para dar aos bots dessas empresas o equivalente digital de um sinal de"Acesso Proibido", você deve editar ou criar um arquivo chamado"robots.txt"no diretório raiz do seu servidor web. Ou seja, seria acessível (sim, qualquer pessoa deveria poder vê-lo) em"https://www.example.com/robots.txt “.

Conseqüentemente, o arquivo “robots.txt” do The New York Times atualmente restringe o acesso ao ChatGPT e ao Bard.

Este arquivo serve como um conjunto de instruções para bots e rastreadores da web. Até agora, Tem sido utilizado principalmente para dar instruções aos motores de busca (também é possível excluir deles o nosso conteúdo).

/images/9d59aba80f8ffabb92535079fff6b8618c33fa70504bd46c18d8f48ff6ac97dd.jpg Neste site ChatGPT e outras IAs precisam de enormes conjuntos de dados para evoluir: eles podem estar esgotados já em 2026

Instruções para bloquear a raspagem do ChatGPT e do Google Bard

Para evitar que esses modelos específicos tenham acesso ao seu site, é necessário incorporar as diretivas mencionadas em seu arquivo de protocolo de exclusão de robôs.

-Para ChatGPT:

Agente do usuário: GPTBot Proibir:/

-Para Google Bardo:

Agente do usuário: Google-Extended Proibir:/

Em’Disallow’você pode especificar apenas algumas pastas específicas a serem bloqueadas , caso você não se importe com o resto do conteúdo do seu site sendo usado (o símbolo'/‘indica o diretório raiz e todos aqueles que depende disso… ou seja, de todo o site).

0

Por exemplo, talvez você não se importe que a maioria dos dados do seu site seja usada para treinar IAs, mas o site inclui um blog que você usa como diário pessoal. Tudo bem: você pode optar por bloquear pastas específicas. Então, se o blog estiver localizado no seu site no endereço “seusite.com/blog”, você usaria o seguinte:

1-Para ChatGPT:

Agente do usuário: GPTBot Proibir:/blog

-Para Google Bardo:

Agente do usuário: Google-Extended Proibir:/blog

Através de | EFE

2

Imagem | Marcos Merino por meio de IA

Hospedagem na Web refere-se ao serviço que permite que indivíduos ou organizações tornem seus sites acessíveis na Internet por meio de um servidor web. Existem vários tipos diferentes de serviços de hospedagem na web disponíveis, incluindo hospedagem compartilhada, servidores virtuais privados (VPS), hospedagem dedicada e hospedagem em nuvem. Cada tipo tem suas próprias vantagens e desvantagens em termos de custo, desempenho, flexibilidade e escalabilidade. Compreender essas diferenças pode ajudá-lo a escolher a melhor opção para as necessidades do seu site.

3

*️⃣ Link da fonte:

robots.txt , EFF ,