29 de febrero de 2024 El 29 de febrero de 2024.

por

Publicado por Stealth

0

Tumblr y WordPress venderán datos de usuarios a OpenAi

GPT AI, Internet, WordPress

Tumblr y WordPress venderán datos de usuarios a OpenAi

Publicado por

Stealth

29 de febrero de 2024 El 29 de febrero de 2024.

0

Automattic, la empresa detrás de WordPress y Tumblr, está en conversaciones para monetizar el contenido de los usuarios vendiendo sus datos a empresas de inteligencia artificial, incluidas MidJourney y OpenAI. Estos datos de las plataformas de blogs Tumblr y WordPress.com se utilizarán para entrenar los modelos de IA.

Si bien los detalles de la transacción aún no están claros, la noticia ha generado preocupación entre los usuarios sobre el posible uso indebido de su contenido privado en las dos plataformas de blogs. 404 Media también sugiere que surgieron conflictos internos dentro de Automattic porque el contenido recopilado incluía datos privados que no estaban destinados a ser conservados dentro de la empresa.

En respuesta a la reacción, Automattic está preparado para introducir una nueva función que permitirá a los usuarios optar por no compartir sus datos para el entrenamiento de IA. La compañía, en una publicación de blog, afirma su compromiso de brindar a los usuarios de Tumblr y Wordpress más control sobre su contenido. Menciona la liberación de una configuración para “para desalentar la exploración por parte de empresas de IA”, explicando que las principales plataformas de exploración de IA están bloqueadas de forma predeterminada.

El problema del uso de contenidos de blogs por parte de empresas que desarrollan modelos de IA no se limita únicamente a las plataformas gestionadas por la empresa Automattic. Tanto OpenAI como Google utilizan robots rastreadores que recopilan información de todos los sitios web para entrenar sus modelos de IA. El proceso es similar a la recopilación de datos por parte de los motores de búsqueda.

¿Cómo puedes impedir que OpenAI y Gemini (Bard) tomen datos de tu blog?

Si eres propietario de un blog o sitio web y no quieres que los datos del mismo se utilicen para entrenar los modelos de inteligencia artificial OpenAI y Gemini, puedes bloquear el acceso de robots (rastreadores) al contenido. Esta restricción se puede establecer a través del archivo robots.txt.

OpenAI Crawlers

User-agent: GPTBot
Disallow: /

Gemini Crawlers

User-agent: Google-Extended
Disallow: /

Después de guardar el archivo robots.txt con las nuevas líneas, vaya a Google Console para: Settings > robots.txt > haga clic en el menú con los tres puntos, haga clic en “Request a recrawl“.

Tumblr y WordPress venderán datos de usuarios a OpenAi — Solicitud de rastreo

Relacionado: GPT-5 y la nueva web Crawler GPTBOT desarrollada por OpenAI

Para los usuarios de Tumblr y Wordpress, el acceso a la recuperación de datos de blogs por parte de OpenAI u otras empresas de desarrollo de inteligencia artificial podrá bloquearse mediante las herramientas puestas a disposición por la empresa Automattic.

Tumblr y WordPress venderán datos de usuarios a OpenAi

GPT AI, Internet, WordPress

Acerca de Stealth

Apasionado por la tecnología, escribo con gusto en StealthSettings.com desde el año 2006. Tengo una amplia experiencia en sistemas operativos: macOS, Windows y Linux, así como en lenguajes de programación y plataformas de blogs (WordPress) y para tiendas en línea (WooCommerce, Magento, PrestaShop).

Ver todas las publicaciones de Stealth

Activa la vista previa de archivos PDF, Excel o Word en Windows 11 – (Preview Pane)

Habilita la vista previa de archivos PDF, Excel, Word o PowerPoint en el Explorador de archivos (Panel de vista previa). Tutorial paso a paso.

Continuar leyendo

27 Mar

Noticias en Windows 11 Build 27823. Tarjetas superiores.

Microsoft presenta tarjetas superiores en Build 27823. Las tarjetas superiores proporcionan una vista rápida de la información de hardware más importante.

Continuar leyendo

25 Mar

Cómo eliminar los parámetros _gl y _ga de las URL de un sitio web.

Descubra por qué aparecen, qué son y cómo elimina los parámetros _gl y _GA de las URL de los subdominios de un sitio web con Google Analytics.

Continuar leyendo

23 Mar

¿Disminución repentina del tráfico orgánico en el sitio en marzo de 2025? Actualización del núcleo de búsqueda de Google

Si ha notado una disminución repentina en el tráfico orgánico en el sitio en marzo de 2025, lo más probable es que tenga que hacer algunos cambios de SEO.

Continuar leyendo