O mundo dos robots.txt

Como sites implementam regras para evitar que empresas usem seu conteúdo para treinar inteligência artificial

Criado em 29.10.2024

Última atualização em 22.11.2024

Qualquer website pode indicar suas regras acerca de acessos automatizados a partir de um arquivo simples de texto colocado no diretório central, chamado robots.txt.

Esse arquivo foi inicialmente utilizado para indicar se um website dá ou não permissão para indexação de mecanismos de buscas, mas pode servir para qualquer crawler (bots que entram num site em busca de conteúdo).

Saiba mais

Diretriz, não barreira técnica: O robots.txt é uma recomendação e não uma medida de segurança. Ele depende da cooperação voluntária dos bots para ser respeitado.
Desrespeito por bots maliciosos ou IA: Nos últimos anos, surgiu uma preocupação crescente, especialmente por parte de veículos jornalísticos, sobre o fato de que empresas de inteligência artificial e crawlers não autorizados têm ignorado essas diretrizes.
Como exemplo, o arquivo robots.txt do Núcleo está neste link.

O criador desse Xarta permitiu sua reprodução via Licença Creative Commons 4.0. Acesse esta página para utilizar o código de embed.

Veja mais

O que é fair use?

Fair use (uso justo) é uma exceção aos direitos autorais prevista na legislação dos Estados Unidos

O que prevê a Lei de Acesso à Informação?

A Lei de Acesso à Informação - LAI (Lei nº 12.527/2011) estabelece que qualquer cidadão tem o direito de solicitar e receber informações públicas de órgãos e entidades dos três poderes (Executivo, Legislativo e Judiciário) em todos os níveis (União, Estados, DF e Municípios), para tornar a transparência

O que são agentes de IA

Agentes de IA são bots que realizaram tarefas em nome de usuários, como programação, compras online, escrever textos etc. com mínima ou nenhuma intervenção humana.

O que são bets

As apostas de quota fixa, conhecidas como bets, são uma modalidade de loteria onde o apostador sabe o valor do retorno caso seu palpite esteja correto. Elas podem ser aplicadas tanto em eventos esportivos reais (como jogos de futebol e vôlei) quanto em eventos virtuais de jogos online.