Automattic, компанія, що стоїть за WordPress і Tumblr, веде переговори про монетизацію користувацького контенту шляхом продажу своїх даних компаніям штучного інтелекту, зокрема MidJourney і OpenAI. Ці дані з платформ блогів Tumblr і WordPress.com будуть використовуватися для навчання моделей AI.
Хоча деталі транзакції все ще неясні, ця новина викликала занепокоєння серед користувачів щодо можливого зловживання їхнім приватним вмістом на двох платформах блогів. 404 Media також припускає, що внутрішні конфлікти виникли в Automattic через те, що зібраний контент включав приватні дані, які не призначені для зберігання в компанії.
У відповідь на негативну реакцію Automattic збирається представити нову функцію, яка дозволить користувачам відмовитися від обміну своїми даними для навчання ШІ. У дописі в блозі компанія підтверджує своє зобов’язання надати користувачам Tumblr і Wordpress більше контролю над їхнім вмістом. Згадується звільнення налаштування для “перешкоджати розвідці компаній штучного інтелекту”, пояснюючи, що провідні дослідницькі платформи ШІ заблоковано за умовчанням.
Проблема використання контенту з блогів компаніями, що розробляють моделі ШІ, не обмежується лише платформами, якими керує компанія Automattic. І OpenAI, і Google використовують роботи-сканери, які збирають інформацію з усіх веб-сайтів для навчання своїх моделей ШІ. Процес схожий на збір даних пошуковими системами.
Як можна заблокувати OpenAI і Gemini (Bard) отримання даних із вашого блогу?
Якщо ви є власником блогу або веб-сайту і не хочете, щоб дані з нього використовувалися для навчання моделей штучного інтелекту OpenAI і Gemini, ви можете заблокувати доступ роботів (сканерів) до вмісту. Це обмеження можна встановити через файл robots.txt.
OpenAI Crawlers
User-agent: GPTBot
Disallow: /
Gemini Crawlers
User-agent: Google-Extended
Disallow: /
Після того як ви збережете файл robots.txt із новими рядками, перейдіть до Google Console, щоб: Settings > robots.txt > натисніть на меню з трьома крапками, натисніть “Request a recrawl“.

Пов'язаний: GPT-5 і новий веб-сканер GPTBot, розроблений OpenAI
Для користувачів Tumblr і Wordpress доступ до отримання даних із блогів OpenAI або інших компаній-розробників штучного інтелекту можна буде заблокувати за допомогою інструментів, наданих компанією Automattic.
Tumblr та WordPress продаватимуть дані користувачів на OpenAI
Що нового
Про Stealth
Пристрасний до технологій, я із задоволенням пишу на Stealthsetts.com, починаючи з 2006 року. У мене багатий досвід роботи в операційних системах: MacOS, Windows та Linux, а також у програмах програмування та платформ ведення блогів (WordPress) та для інтернет -магазинів (WooCommerce, Magento, Presashop).
Переглянути всі дописи від StealthВас також може зацікавити...