Το Tumblr και το WordPress θα πουλήσουν δεδομένα χρηστών στο OpenAI

Η Automattic, η εταιρεία πίσω από το WordPress και το Tumblr, βρίσκεται σε συνομιλίες για τη δημιουργία εσόδων από το περιεχόμενο των χρηστών πουλώντας τα δεδομένα του σε εταιρείες τεχνητής νοημοσύνης, συμπεριλαμβανομένων των MidJourney και OpenAI. Αυτά τα δεδομένα από τις πλατφόρμες blogging Tumblr και WordPress.com θα χρησιμοποιηθούν για την εκπαίδευση των μοντέλων AI.

Ενώ οι λεπτομέρειες της συναλλαγής είναι ακόμη ασαφείς, η είδηση έχει προκαλέσει ανησυχίες στους χρήστες σχετικά με την πιθανή κακή χρήση του ιδιωτικού περιεχομένου τους στις δύο πλατφόρμες ιστολογίων. Το 404 Media προτείνει επίσης ότι προέκυψαν εσωτερικές διενέξεις στο Automattic επειδή το περιεχόμενο που συλλέχθηκε περιελάμβανε προσωπικά δεδομένα που δεν προοριζόταν να διατηρηθούν στην εταιρεία.

Σε απάντηση στις αντιδράσεις, η Automattic πρόκειται να εισαγάγει μια νέα δυνατότητα που θα επιτρέπει στους χρήστες να εξαιρεθούν από την κοινή χρήση των δεδομένων τους για εκπαίδευση τεχνητής νοημοσύνης. Η εταιρεία, σε μια ανάρτηση ιστολογίου, επιβεβαιώνει τη δέσμευσή της να παρέχει στους χρήστες του Tumblr και του Wordpress μεγαλύτερο έλεγχο του περιεχομένου τους. Αναφέρει την κυκλοφορία μιας ρύθμισης για “να αποθαρρύνει την εξερεύνηση από εταιρείες τεχνητής νοημοσύνης”, εξηγώντας ότι οι κορυφαίες πλατφόρμες εξερεύνησης τεχνητής νοημοσύνης είναι αποκλεισμένες από προεπιλογή.

Το πρόβλημα της χρήσης περιεχομένου από ιστολόγια από εταιρείες που αναπτύσσουν μοντέλα AI δεν περιορίζεται μόνο στις πλατφόρμες που διαχειρίζεται η εταιρεία Automattic. Τόσο το OpenAI όσο και η Google χρησιμοποιούν ρομπότ ανίχνευσης που συλλέγουν πληροφορίες από όλους τους ιστότοπους για να εκπαιδεύσουν τα μοντέλα τεχνητής νοημοσύνης τους. Η διαδικασία είναι παρόμοια με τη συλλογή δεδομένων από τις μηχανές αναζήτησης.

Πώς μπορείτε να εμποδίσετε το OpenAI και το Gemini (Bard) να λαμβάνουν δεδομένα από το ιστολόγιό σας;

Εάν είστε ιδιοκτήτης ιστολογίου ή ιστότοπου και δεν θέλετε τα δεδομένα από αυτό να χρησιμοποιούνται για την εκπαίδευση των μοντέλων τεχνητής νοημοσύνης OpenAI και Gemini, μπορείτε να αποκλείσετε την πρόσβαση ρομπότ (ανιχνευτές) στο περιεχόμενο. Αυτός ο περιορισμός μπορεί να οριστεί μέσω του αρχείου robots.txt.

OpenAI Crawlers

User-agent: GPTBot
Disallow: /

Gemini Crawlers

User-agent: Google-Extended
Disallow: /

Αφού αποθηκεύσετε το αρχείο robots.txt με τις νέες γραμμές, μεταβείτε στην Κονσόλα Google για να: Settings > robots.txt > κάντε κλικ στο μενού με τις τρεις τελείες, κάντε κλικ “Request a recrawl“.

Το Tumblr και το WordPress θα πουλήσουν δεδομένα χρηστών στο OpenAI — Αίτημα εκ νέου ανίχνευσης

Συγγενεύων: Το GPT-5 και το νέο CRAWLER GPTBOT Web που αναπτύχθηκε από το OpenAI

Για τους χρήστες του Tumblr και του Wordpress, η πρόσβαση στην ανάκτηση δεδομένων από ιστολόγια από την OpenAI ή άλλες εταιρείες ανάπτυξης τεχνητής νοημοσύνης θα μπορεί να αποκλειστεί μέσω των εργαλείων που διατίθενται από την εταιρεία Automattic.