GPT-5 en het nieuwe Crawler GPTBOT-web ontwikkeld door OpenAI
Nu cred ca va mai dura mult până când OpenAI va intra în joc și pentru dezvoltarea unui motor de căutare bazat pe inteligență artificială. Noul web crawler GPTBot cu modelul de limbaj larg GPT-5 este deja lansat.
Cei care utilizează ChatGPT știu că acest model de limbaj larg (LLM) rulează în prezent GPT-3.5, fiind antrenat pe un set de date actualizat în septembrie 2021. Astfel că dacă sunt solicitate informații mai noi de această dată, Chatgpt nu este capabil să ofere informații exacte. Desigur, valabil pentru versiunea gratuită care nu suportă utilizarea de plugin-uri auxiliare.
Odată cu lansarea GPTBot, OpenAI heeft de weg vrij voor het indexeren van webpagina's via deze nieuwe webcrawler. Zoals bedrijven als Google, Microsoft, Yahoo en vele anderen al jaren doen.
GPT-5 en het nieuwe Crawler GPTBOT-web ontwikkeld door OpenAI
De nieuwe webcrawler die GPTBot gebruikt web agent:
User agent token: GPTBot
Full user-agent string: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)
Website-eigenaren kunnen de indexering van webpagina's via het bestand beheren robots.txt, waarbij dezelfde richtlijnen worden gebruikt als voor andere webcrawlers van andere bedrijven.
Als de eigenaar van een website bijvoorbeeld niet wil dat OpenAI informatie van de website verzamelt, kan hij of zij dit toevoegen robots.txt de lijnen:
User-agent: GPTBot
Disallow: /
Chiar dacă se comportă ca un web crawler, GPTBot va avea un scop distinct: să culeagă date disponibile public, evitând în același timp cu atenție sursele care implică paywall-uri, colectarea datelor personale sau conținut care contravine politicilor OpenAI.
Există însă destul de multe controverse, unele care au atras chiar acțiuni juridice asupra companiei OpenAI pe tema confidențialității și a utilizării de conținut fără acordul autorilor sau fără a peciza sursele.
În iunie, autoritatea de reglementare a confidențialității din Japonia a emis un avertisment către OpenAI cu privire la colectarea neautorizată a datelor. De asemenea, la începutul acestui an, Italia a interzis temporar utilizarea ChatGPT din cauza presupuselor încălcări ale legilor Uniunii Europene privind confidențialitatea.
GPT-5 en het nieuwe Crawler GPTBOT-web ontwikkeld door OpenAI
Wat is nieuw
Over Stealth
Gepassioneerd door technologie schrijf ik met plezier op StealthSettings.com sinds 2006. Ik heb veel ervaring met besturingssystemen: macOS, Windows en Linux, maar ook met programmeertalen en bloggingplatforms (WordPress) en voor webshops (WooCommerce, Magento, PrestaShop).
Bekijk alle berichten van StealthMogelijk bent u ook geïnteresseerd in...