29 février 2024 On February 29, 2024

par

Publié par Stealth

0

Tumblr et WordPress vendront des données d'utilisateurs à OpenAI

GPT AI, Internet, WordPress

Tumblr et WordPress vendront des données d'utilisateurs à OpenAI

Publié par

Stealth

29 février 2024 On February 29, 2024

0

Automattic, compania din spatele WordPress și Tumblr, are în plan discuții pentru a monetiza conținutul utilizatorilor prin vânzarea datelor sale către companii de inteligență artificială, inclusiv MidJourney și OpenAI. Aceste date de pe platformele de blogging Tumblr si WordPress.com vor fi utilizate pentru antrenarea modelelor AI.

Bien que les détails de la transaction ne soient pas encore clairs, la nouvelle a suscité des inquiétudes parmi les utilisateurs quant à une éventuelle utilisation abusive de leur contenu privé sur les deux plateformes de blogs. 404 Media suggère également que des conflits internes sont survenus au sein d'Automattic parce que le contenu collecté incluait des données privées qui n'étaient pas destinées à être conservées au sein de l'entreprise.

En réponse à cette réaction, Automattic s'apprête à introduire une nouvelle fonctionnalité qui permettra aux utilisateurs de refuser de partager leurs données pour la formation en IA. La société, dans un article de blog, affirme son engagement à donner aux utilisateurs de Tumblr et Wordpress plus de contrôle sur leur contenu. Mentionne la publication d'un paramètre pour “décourager l’exploration par les sociétés d’IA”, expliquant que les principales plateformes d'exploration de l'IA sont bloquées par défaut.

La problématique de l’utilisation des contenus des blogs par les entreprises développant des modèles d’IA ne se limite pas aux seules plateformes gérées par la société Automattic. OpenAI et Google utilisent tous deux des robots d'exploration qui collectent des informations sur tous les sites Web pour entraîner leurs modèles d'IA. Le processus est similaire à la collecte de données par les moteurs de recherche.

Comment pouvez-vous empêcher OpenAI et Gemini (Bard) de récupérer les données de votre blog ?

Si vous êtes propriétaire d'un blog ou d'un site Web et que vous ne souhaitez pas que les données de celui-ci soient utilisées pour entraîner les modèles d'intelligence artificielle OpenAI et Gemini, vous pouvez bloquer l'accès des robots (crawlers) au contenu. Cette restriction peut être définie via le fichier robots.txt.

OpenAI Crawlers

User-agent: GPTBot
Disallow: /

Gemini Crawlers

User-agent: Google-Extended
Disallow: /

Après avoir enregistré le fichier robots.txt avec les nouvelles lignes, accédez à la console Google pour : Settings > robots.txt > cliquez sur le menu avec les trois points, cliquez “Request a recrawl“.

Tumblr et WordPress vendront des données d'utilisateurs à OpenAI — Demande de réexploration

Liens : GPT-5 et le nouveau Crawler GPTBOT Web développé par OpenAI

Pour les utilisateurs de Tumblr et Wordpress, l'accès aux données de récupération des blogs par OpenAI ou d'autres sociétés de développement d'intelligence artificielle pourra être bloqué grâce aux outils mis à disposition par la société Automattic.

Tumblr et WordPress vendront des données d'utilisateurs à OpenAI

GPT AI, Internet, WordPress

À propos Stealth

Passionné de technologie, j'écris avec plaisir sur StealthSettings.com depuis l'année 2006. J'ai une vaste expérience des systèmes d'exploitation : macOS, Windows et Linux, ainsi que des langages de programmation et des plateformes de blogging (WordPress) et pour les boutiques en ligne (WooCommerce, Magento, PrestaShop).

Voir tous les messages de Stealth

Vous pourriez également être intéressé par...

24 Déc

Activez l’aperçu des fichiers PDF, Excel ou Word dans Windows 11 – (Volet d'aperçu)

Activez l'aperçu des fichiers PDF, Excel, Word ou PowerPoint dans l'Explorateur de fichiers (volet de prévisualisation). Tutoriel étape par étape.

Continuer à lire

27 Mar

Nouveautés de Windows 11 Build 27823. Top Cartes.

Microsoft introduit Top Cards dans Build 27823. Top Cards offre une vue rapide des informations les plus importantes sur le matériel.

Continuer à lire

25 Mar

Comment supprimer les paramètres _gl et _ga des URL d'un site web.

Découvrez d'où ils viennent, ce qu'ils sont et comment supprimer les paramètres _gl et _ga des URL des sous-domaines d'un site web avec Google Analytics.

Continuer à lire

23 Mar

Chute brutale du trafic organique sur le site en mars 2025 ? Mise à jour principale de Google Search

Si vous remarquez une chute soudaine du trafic organique sur le site en mars 2025, il est très probable que vous deviez apporter quelques modifications SEO.

Continuer à lire

17 Mar

Comment configurer Fail2Ban pour WordPress (wp-login, xmlrpc)

Voyez comment vous pouvez installer et configurer Fail2Ban pour WordPress. Sécurochez l'authentification de WordPress et xmlrpc.php.

Continuer à lire

02 Mar

Qu'apporte le nouveau GPT-4.5 ? Le modèle ChatGPT le plus performant.

Découvrez les nouvelles capacités de GPT-4.5 et la façon dont le nouveau modèle d'intelligence artificielle interagit avec les utilisateurs de ChatGPT.

Continuer à lire

21 Fév

Le logiciel espion Pegasus détecté sur seulement la moitié des iPhones

Profitant des vulnérabilités zéro-jour, les logiciels espions Pegasus ne peuvent pas être détectés uniquement dans la moitié des appareils iPhone infectés.

Continuer à lire