Tumblr

за

0

Tumblr та WordPress продаватимуть дані користувачів на OpenAI

Tumblr та WordPress продаватимуть дані користувачів на OpenAI

0
Tumblr

Automattic, компанія, що стоїть за WordPress і Tumblr, веде переговори про монетизацію користувацького контенту шляхом продажу своїх даних компаніям штучного інтелекту, зокрема MidJourney і OpenAI. Ці дані з платформ блогів Tumblr і WordPress.com будуть використовуватися для навчання моделей AI.

Хоча деталі транзакції все ще неясні, ця новина викликала занепокоєння серед користувачів щодо можливого зловживання їхнім приватним вмістом на двох платформах блогів. 404 Media також припускає, що внутрішні конфлікти виникли в Automattic через те, що зібраний контент включав приватні дані, які не призначені для зберігання в компанії.

У відповідь на негативну реакцію Automattic збирається представити нову функцію, яка дозволить користувачам відмовитися від обміну своїми даними для навчання ШІ. У дописі в блозі компанія підтверджує своє зобов’язання надати користувачам Tumblr і Wordpress більше контролю над їхнім вмістом. Згадується звільнення налаштування для “перешкоджати розвідці компаній штучного інтелекту”, пояснюючи, що провідні дослідницькі платформи ШІ заблоковано за умовчанням.

Проблема використання контенту з блогів компаніями, що розробляють моделі ШІ, не обмежується лише платформами, якими керує компанія Automattic. І OpenAI, і Google використовують роботи-сканери, які збирають інформацію з усіх веб-сайтів для навчання своїх моделей ШІ. Процес схожий на збір даних пошуковими системами.

Як можна заблокувати OpenAI і Gemini (Bard) отримання даних із вашого блогу?

Якщо ви є власником блогу або веб-сайту і не хочете, щоб дані з нього використовувалися для навчання моделей штучного інтелекту OpenAI і Gemini, ви можете заблокувати доступ роботів (сканерів) до вмісту. Це обмеження можна встановити через файл robots.txt.

OpenAI Crawlers

User-agent: GPTBot
Disallow: /

Gemini Crawlers

User-agent: Google-Extended
Disallow: /

Після того як ви збережете файл robots.txt із новими рядками, перейдіть до Google Console, щоб: Settings > robots.txt > натисніть на меню з трьома крапками, натисніть “Request a recrawl“.

Tumblr та WordPress продаватимуть дані користувачів на OpenAI
Запит на повторне сканування

Пов'язаний: GPT-5 і новий веб-сканер GPTBot, розроблений OpenAI

Для користувачів Tumblr і Wordpress доступ до отримання даних із блогів OpenAI або інших компаній-розробників штучного інтелекту можна буде заблокувати за допомогою інструментів, наданих компанією Automattic.

Tumblr та WordPress продаватимуть дані користувачів на OpenAI

Вас також може зацікавити...

Залиште відповідь

Ваша електронна адреса не буде опублікована. Необхідні поля позначені *