Descubra como impedir que o ChatGPT use o conteúdo do seu site

O ChatGPT é uma ferramenta de inteligência artificial que tem ganhado destaque nas últimas semanas. Entre um dos seus pontos principais está a criação de textos. Mas, como são criados esses conteúdos?

Segundo os próprios criadores, o algorítimo do ChatGPT é programado para aprender com conteúdos distribuídos pela internet e, também, com as respostas fornecidas pelos usuários ao interagir com ele.

Na prática, cada vez que você pede uma informação, o robô confirma com você se está correto ou não. Se algum erro for identificado, você pode pedir para que ele corrija, fornecendo o dado correto e, assim, colaborando para a aprendizagem da máquina.

Porém, é normal que produtores de conteúdo e sites empresariais não queiram que o seus conteúdos originais sejam utilizados pelo ChatGPT para fornecer respostas aos seus usuários.

Com isso, surgem diversas perguntas, como a legitimidade de acesso a esses conteúdos, se é ético que o robô utilize esses textos para criar novos artigos e, principalmente, se temos como bloquear o seu acesso.

Como funciona a leitura de dados do robô?

De forma resumida, não é tão fácil impedir que o ChatGPT utilize o seu site como referência de conteúdo, mas algumas medidas podem valer a tentativa.

Segundo os desenvolvedores, o algorítimo utiliza as seguintes formas de captar referências:

  • Rastreamento comum de conteúdo online (filtrado)
  • WebText2 (com rastreamento de conteúdo online)
  • Livros1
  • Livros2
  • Wikipédia

Dessa forma, os desenvolvedores podem aplicar filtros e criar listas de fontes confiáveis de conteúdos para serem referência, evitando dados imprecisos ou até fake news e discurso de ódio.

Porém, com a infinidade de conteúdo online, as bases de dados do robô já contam com mais de 19 bilhões de tokens, tendo como parâmetro a avaliação do Reddit.

Dessa forma, sites inseridos no Reddit que tenham pelo menos três avaliações positivas podem ser utilizados pelo ChatGPT como fonte de conteúdo. Então, se o seu site estiver lá, tem chances de ser utilizado.

Já com o rastreamento comum pode ficar um pouco mais fácil de evitar a leitura pelo ChatGPT, mas não é garantido.

Utilizando um bloqueio do agente CCBot/2.0 do ChatGPT, é possível solicitar que ele não tenha acesso ao site. Porém, esse recurso também pode bloquear o seu site para robôs de publicidade, como listas de sites de referência em determinados assuntos.

De qualquer forma, o debate sobre a legitimidade de uso do ChatGPT ainda vai longe. Entre os materiais já disponíveis, o artigo Is ChatGPT Use Of Web Content Fair? contribui com a discussão.

 

Vá mais longe com a Studio Visual

Sua empresa precisa de especialistas em tecnologia? Há mais de 21 anos, a Studio Visual atua no mercado de soluções digitais, oferecendo serviços em diferentes frentes, como Desenvolvimento, UX e UI, SEO, Content Marketing e muito mais. 

Saiba como podemos ajudar a sua empresa a alcançar melhores resultados. Converse com um de nossos especialistas!

Compartilhar

Artigo Recente

Entenda a situação do Google na União Europeia

Em mais um capítulo da saga de disputas antitruste contra grandes empresas de tecnologia, o Google teve uma nova atualização.…

11 de setembro de 2024

STF ameaça suspender X, rede está sem representante no Brasil

Em uma nova reviravolta no caso envolvendo a plataforma X (antigo Twitter), o Superior Tribunal Federal (STF) deu um ultimato…

11 de setembro de 2024

Google aumenta recompensas para quem encontrar falhas na segurança do Chrome

Em uma iniciativa para fortalecer ainda mais a segurança do navegador Chrome, o Google anunciou um aumento significativo nas recompensas…

11 de setembro de 2024

Tumblr migrará mais de 500 milhões de blogs para o WordPress

Nesta última quinta-feira (28), a Automattic, empresa proprietária do Tumblr e do WordPress anunciou que mais de 500 milhões de…

11 de setembro de 2024

Vulnerabilidade crítica no WPML ameaça mais de 1 milhão de sites WordPress

Uma falha de segurança grave descoberta no plugin WPML para WordPress coloca em risco mais de um milhão de sites.…

11 de setembro de 2024

Conheça o BlueSky, rede social do mesmo criador do Twitter

Com o fim das atividades do “X”, antigo Twitter no Brasil, os usuários da plataforma que tiveram suas contas congeladas…

11 de setembro de 2024