Ma ei usu, et see võtab kaua aega, kuni OpenAi tuleb mängu ka tehisintellekti põhjal otsingumootori väljatöötamiseks. Uus Crawler GPTBOT-veeb koos GPT-5 laia keelemudeliga on juba käivitatud.
Need, kes kasutavad ChatGPT -d, teavad, et see lai keelemudel (LLM) töötab praegu GPT-3.5, koolitatakse ajakohastatud andmekogumisse septembris 2021. Nii et kui seekord taotletakse uuemat teavet, siis seekord, Vestlus ei suuda täpset teavet anda. Muidugi kehtib tasuta versiooni jaoks, mis ei toeta lisapistikprogrammide kasutamist.
Käivitamisega GPTBot, OpenAI Sellel on avatud tee veebilehtede indekseerimiseks selle uue roomaja veebi kaudu. Nagu sellised ettevõtted nagu Google, Microsoft, Yahoo ja palju muud, on teinud juba aastaid.
GPT-5 ja uus Crawler GPTBOT-veeb, mille on välja töötanud OpenAi
Uus Crawler GPTBOT Web kasutab web agent:
User agent token: GPTBot
Full user-agent string: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)
Veebisaidi omanikud saavad veebilehtede indekseerimist faili kaudu juhtida robots.txt, kasutades samu direktiive nagu teiste teiste ettevõtete veebi indekseerijatele.
Näiteks kui veebisaidi omanik ei soovi saidilt teavet koguda, saab ta lisada robots.txt read:
User-agent: GPTBot
Disallow: /
Isegi kui nad käituvad nagu roomiku veeb, on GPTBOT -il selgelt selge: koguge avalikult kättesaadavaid andmeid, vältides samal ajal hoolikalt allikaid, mis hõlmavad Paywalli, kogudes isikuandmeid või sisu, mis on vastuolus avatud poliitikatega.
Siiski on üsna palju poleemikat, mõned, kes on isegi ettevõtte OpenAi õiguskaitsevahendeid konfidentsiaalsuse ja sisu kasutamise kohta pälvinud ilma autorite nõusolekuta või allikaid pesemata.
Juunis andis Jaapani privaatsuse reguleeriv asutus OpenAI -le hoiatuse loata andmete kogumise kohta. Ka selle aasta alguses keelas Itaalia ajutiselt ChatGPT kasutamise Euroopa Liidu seaduste väidetavate rikkumiste tõttu.