A Automattic, empresa por trás do WordPress e do Tumblr, está em negociações para monetizar o conteúdo do usuário vendendo seus dados para empresas de inteligência artificial, incluindo MidJourney e OpenAI. Esses dados das plataformas de blog Tumblr e WordPress.com serão usados para treinar os modelos de IA.
Embora os detalhes da transação ainda não sejam claros, a notícia levantou preocupações entre os usuários sobre o potencial uso indevido de seu conteúdo privado nas duas plataformas de blog. A 404 Media também sugere que surgiram conflitos internos dentro da Automattic porque o conteúdo coletado incluía dados privados que não deveriam ser retidos dentro da empresa.
Em resposta à reação, a Automattic está preparada para introduzir um novo recurso que permitirá aos usuários optar por não compartilhar seus dados para treinamento de IA. A empresa, em postagem no blog, afirma seu compromisso em dar aos usuários do Tumblr e Wordpress mais controle sobre seu conteúdo. Menciona a liberação de uma configuração para “para desencorajar a exploração por empresas de IA”, explicando que as principais plataformas de exploração de IA são bloqueadas por padrão.
O problema da utilização de conteúdos de blogs por empresas que desenvolvem modelos de IA não se limita apenas às plataformas geridas pela empresa Automattic. Tanto a OpenAI quanto o Google usam robôs rastreadores que coletam informações de todos os sites para treinar seus modelos de IA. O processo é semelhante à coleta de dados pelos motores de busca.
Como você pode impedir que OpenAI e Gemini (Bard) obtenham dados do seu blog?
Se você é dono de um blog ou site e não deseja que os dados dele sejam usados para treinar os modelos de inteligência artificial OpenAI e Gemini, você pode bloquear o acesso de robôs (crawlers) ao conteúdo. Esta restrição pode ser definida através do arquivo robots.txt.
OpenAI Crawlers
User-agent: GPTBot
Disallow: /
Gemini Crawlers
User-agent: Google-Extended
Disallow: /
Depois de salvar o arquivo robots.txt com as novas linhas, acesse o Console do Google para: Settings > robots.txt > clique no menu com os três pontos, clique “Request a recrawl“.

Relacionado: GPT-5 e o novo rastreador da web GPTBot desenvolvido pela OpenAI
Para usuários de Tumblr e Wordpress, o acesso à recuperação de dados de blogs da OpenAI ou de outras empresas de desenvolvimento de inteligência artificial poderá ser bloqueado por meio das ferramentas disponibilizadas pela empresa Automattic.
Tumblr e Wordpress venderão dados de usuários para OpenAI
O que há de novo
Sobre Stealth
Apaixonado por tecnologia, escrevo com prazer no StealthSettings.com desde 2006. Tenho uma vasta experiência em sistemas operativos: macOS, Windows e Linux, bem como em linguagens de programação e plataformas de blogging (WordPress) e para lojas online (WooCommerce, Magento, PrestaShop).
Veja todos os posts de StealthVocê também pode estar interessado em...