Tumblr

por

0

Tumblr e Wordpress venderão dados de usuários para OpenAI

Tumblr e Wordpress venderão dados de usuários para OpenAI

0
Tumblr

A Automattic, empresa por trás do WordPress e do Tumblr, está em negociações para monetizar o conteúdo do usuário vendendo seus dados para empresas de inteligência artificial, incluindo MidJourney e OpenAI. Esses dados das plataformas de blog Tumblr e WordPress.com serão usados ​​para treinar os modelos de IA.

Embora os detalhes da transação ainda não sejam claros, a notícia levantou preocupações entre os usuários sobre o potencial uso indevido de seu conteúdo privado nas duas plataformas de blog. A 404 Media também sugere que surgiram conflitos internos dentro da Automattic porque o conteúdo coletado incluía dados privados que não deveriam ser retidos dentro da empresa.

Em resposta à reação, a Automattic está preparada para introduzir um novo recurso que permitirá aos usuários optar por não compartilhar seus dados para treinamento de IA. A empresa, em postagem no blog, afirma seu compromisso em dar aos usuários do Tumblr e Wordpress mais controle sobre seu conteúdo. Menciona a liberação de uma configuração para “para desencorajar a exploração por empresas de IA”, explicando que as principais plataformas de exploração de IA são bloqueadas por padrão.

O problema da utilização de conteúdos de blogs por empresas que desenvolvem modelos de IA não se limita apenas às plataformas geridas pela empresa Automattic. Tanto a OpenAI quanto o Google usam robôs rastreadores que coletam informações de todos os sites para treinar seus modelos de IA. O processo é semelhante à coleta de dados pelos motores de busca.

Como você pode impedir que OpenAI e Gemini (Bard) obtenham dados do seu blog?

Se você é dono de um blog ou site e não deseja que os dados dele sejam usados ​​para treinar os modelos de inteligência artificial OpenAI e Gemini, você pode bloquear o acesso de robôs (crawlers) ao conteúdo. Esta restrição pode ser definida através do arquivo robots.txt.

OpenAI Crawlers

User-agent: GPTBot
Disallow: /

Gemini Crawlers

User-agent: Google-Extended
Disallow: /

Depois de salvar o arquivo robots.txt com as novas linhas, acesse o Console do Google para: Settings > robots.txt > clique no menu com os três pontos, clique “Request a recrawl“.

Tumblr e Wordpress venderão dados de usuários para OpenAI
Solicitação de novo rastreamento

Relacionado: GPT-5 e o novo rastreador da web GPTBot desenvolvido pela OpenAI

Para usuários de Tumblr e Wordpress, o acesso à recuperação de dados de blogs da OpenAI ou de outras empresas de desenvolvimento de inteligência artificial poderá ser bloqueado por meio das ferramentas disponibilizadas pela empresa Automattic.

Tumblr e Wordpress venderão dados de usuários para OpenAI

Você também pode estar interessado em...

Deixe uma resposta

Seu endereço de e-mail não será publicado. Os campos necessários estão marcados *