GPT-5 și noul web crawler GPTBot dezvoltat de OpenAI

Nu cred ca va mai dura mult până când OpenAI va intra în joc și pentru dezvoltarea unui motor de căutare bazat pe inteligență artificială. Noul web crawler GPTBot cu modelul de limbaj larg GPT-5 este deja lansat.

Cei care utilizează ChatGPT știu că acest model de limbaj larg (LLM) rulează în prezent GPT-3.5, fiind antrenat pe un set de date actualizat în septembrie 2021. Astfel că dacă sunt solicitate informații mai noi de această dată, ChatGPT nu este capabil să ofere informații exacte. Desigur, valabil pentru versiunea gratuită care nu suportă utilizarea de plugin-uri auxiliare.

Odată cu lansarea GPTBot, OpenAI are drum deschis pentru indexarea paginilor web prin intermediul acestui nou web crawler. Așa cum fac de multi ani companii precum Google, Microsoft, Yahoo și multe altele.

GPT-5 și noul web crawler GPTBot dezvoltat de OpenAI

Noul web crawler GPTBot utilizeză web agent:

User agent token: GPTBot
Full user-agent string: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)

Posesorii de website-uri pot controla indexarea paginilor web prin intermediul fișierului robots.txt, utiliând aceleași directive ca și pentru alti web crawleri ai altor companii.

De exemplu, dacă posesorul unui website nu dorește ca OpenAI să culeagă informații de pe site, poate adăuga în robots.txt liniile:

User-agent: GPTBot
Disallow: /

Chiar dacă se comportă ca un web crawler, GPTBot va avea un scop distinct: să culeagă date disponibile public, evitând în același timp cu atenție sursele care implică paywall-uri, colectarea datelor personale sau conținut care contravine politicilor OpenAI.

Există însă destul de multe controverse, unele care au atras chiar acțiuni juridice asupra companiei OpenAI pe tema confidențialității și a utilizării de conținut fără acordul autorilor sau fără a peciza sursele.

În iunie, autoritatea de reglementare a confidențialității din Japonia a emis un avertisment către OpenAI cu privire la colectarea neautorizată a datelor. De asemenea, la începutul acestui an, Italia a interzis temporar utilizarea ChatGPT din cauza presupuselor încălcări ale legilor Uniunii Europene privind confidențialitatea.

Pasionat de tehnologie, scriu cu plăcere pe StealthSettings.com începând cu anul 2006. Am o bogată experiență în sistemele de operare: macOS, Windows și Linux, dar și în limbaje de programare și platforme de blogging (WordPress) și pentru magazine online (WooCommerce, Magento, PrestaShop).

How to » GPT AI » GPT-5 și noul web crawler GPTBot dezvoltat de OpenAI
Leave a Comment