Descubra como impedir que o ChatGPT use o conteúdo do seu site

‏‏‎ ‏‏‎ ‎‎‏‏‎ ‎•‎‏‏‏‎ ‏‏‎ ‎‎‏‏‎ Atualização em 3 de fevereiro de 2023

O ChatGPT é uma ferramenta de inteligência artificial que tem ganhado destaque nas últimas semanas. Entre um dos seus pontos principais está a criação de textos. Mas, como são criados esses conteúdos?

Segundo os próprios criadores, o algorítimo do ChatGPT é programado para aprender com conteúdos distribuídos pela internet e, também, com as respostas fornecidas pelos usuários ao interagir com ele.

Na prática, cada vez que você pede uma informação, o robô confirma com você se está correto ou não. Se algum erro for identificado, você pode pedir para que ele corrija, fornecendo o dado correto e, assim, colaborando para a aprendizagem da máquina.

Porém, é normal que produtores de conteúdo e sites empresariais não queiram que o seus conteúdos originais sejam utilizados pelo ChatGPT para fornecer respostas aos seus usuários.

Com isso, surgem diversas perguntas, como a legitimidade de acesso a esses conteúdos, se é ético que o robô utilize esses textos para criar novos artigos e, principalmente, se temos como bloquear o seu acesso.

Como funciona a leitura de dados do robô?

De forma resumida, não é tão fácil impedir que o ChatGPT utilize o seu site como referência de conteúdo, mas algumas medidas podem valer a tentativa.

Segundo os desenvolvedores, o algorítimo utiliza as seguintes formas de captar referências:

  • Rastreamento comum de conteúdo online (filtrado)
  • WebText2 (com rastreamento de conteúdo online)
  • Livros1
  • Livros2
  • Wikipédia

Dessa forma, os desenvolvedores podem aplicar filtros e criar listas de fontes confiáveis de conteúdos para serem referência, evitando dados imprecisos ou até fake news e discurso de ódio.

Porém, com a infinidade de conteúdo online, as bases de dados do robô já contam com mais de 19 bilhões de tokens, tendo como parâmetro a avaliação do Reddit.

Dessa forma, sites inseridos no Reddit que tenham pelo menos três avaliações positivas podem ser utilizados pelo ChatGPT como fonte de conteúdo. Então, se o seu site estiver lá, tem chances de ser utilizado.

Já com o rastreamento comum pode ficar um pouco mais fácil de evitar a leitura pelo ChatGPT, mas não é garantido.

Utilizando um bloqueio do agente CCBot/2.0 do ChatGPT, é possível solicitar que ele não tenha acesso ao site. Porém, esse recurso também pode bloquear o seu site para robôs de publicidade, como listas de sites de referência em determinados assuntos.

De qualquer forma, o debate sobre a legitimidade de uso do ChatGPT ainda vai longe. Entre os materiais já disponíveis, o artigo Is ChatGPT Use Of Web Content Fair? contribui com a discussão.

 

Vá mais longe com a Studio Visual

Sua empresa precisa de especialistas em tecnologia? Há mais de 21 anos, a Studio Visual atua no mercado de soluções digitais, oferecendo serviços em diferentes frentes, como Desenvolvimento, UX e UI, SEO, Content Marketing e muito mais. 

Saiba como podemos ajudar a sua empresa a alcançar melhores resultados. Converse com um de nossos especialistas!

Gostou deste artigo? Não esqueça de compartilhar.
Facebook
Twitter
LinkedIn

Leia também

Seja Wiki WordPress

Estamos constantemente postando conteúdo para fortalecer o conhecimento de desenvolvedores e webdesigners. Faça parte da comunidade Wiki WordPress!