Nemyslím si, že bude trvat dlouho, než OpenAI vstoupí do hry také pro vývoj vyhledávače založeného na AI. Nový webový prohledávač GPTBot s širokým jazykovým modelem GPT-5 je již vydán.
Cei care utilizează ChatGPT știu că acest model de limbaj larg (LLM) aktuálně používá GPT-3.5 a probíhá školení na datové sadě aktualizované v září 2021. Pokud tedy požadujete novější informace než toto datum, CHATGPT není schopen poskytnout přesné informace. Samozřejmě platí pro bezplatnou verzi, která nepodporuje použití pomocných pluginů.
Se spuštěním GPTBot, OpenAI má otevřenou cestu pro indexování webových stránek prostřednictvím tohoto nového webového prohledávače. Tak, jak to již řadu let dělají společnosti jako Google, Microsoft, Yahoo a mnoho dalších.
GPT-5 a nový prohledávač GPTBOT Web vyvinutý společností OpenAI
Nový webový prohledávač GPTBot používá web agent:
User agent token: GPTBot
Full user-agent string: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)
Vlastníci webových stránek mohou řídit indexování webových stránek prostřednictvím souboru robots.txt, pomocí stejných direktiv jako pro jiné webové prohledávače od jiných společností.
Pokud například vlastník webu nechce, aby OpenAI shromažďovala informace z webu, může se přidat robots.txt řádky:
User-agent: GPTBot
Disallow: /
I když se chová jako webový prohledávač, GPTBot bude mít jasný účel: shromažďovat veřejně dostupná data a přitom se pečlivě vyhýbat zdrojům, které zahrnují paywally, shromažďování osobních údajů nebo obsah, který porušuje zásady OpenAI.
Existuje však několik kontroverzí, některé dokonce vyvolaly právní kroky proti OpenAI kvůli soukromí a používání obsahu bez souhlasu autorů nebo bez identifikace zdrojů.
V červnu vydal japonský regulátor ochrany osobních údajů OpenAI varování před neoprávněným sběrem dat. Také začátkem tohoto roku Itálie dočasně zakázala používání ChatGPT kvůli údajnému porušení zákonů Evropské unie na ochranu soukromí.