인공 지능을 기반으로 한 검색 엔진의 개발을 위해 OpenAI가 작용할 때까지 오래 걸릴 것이라고 생각합니다. GPT-5 와이드 언어 모델이 포함 된 새로운 Crawler GPTBOT 웹이 이미 시작되었습니다.
chatgpt를 사용하는 사람들은이 광범위한 언어 모델을 알고 있습니다.LLM) 현재 GPT-3.5를 실행하고 있으며 2021 년 9 월에 업데이트 된 데이터 세트에 대한 교육을 받고 있습니다. 따라서 이번에는 새로운 정보가 요청되면 chatgpt 정확한 정보를 제공 할 수 없습니다. 물론 보조 플러그인 사용을 지원하지 않는 무료 버전에 유효합니다.
출시와 함께 GPTBot, OpenAI 이 새로운 크롤러 웹을 통해 웹 페이지를 색인화 할 수있는 열린 경로가 있습니다. Google, Microsoft, Yahoo 등과 같은 회사는 수년간 일해 왔습니다.
GPT-5 및 OpenAI에서 개발 한 새로운 Crawler GPTBOT 웹
새로운 Crawler GPTBOT 웹은 사용합니다 web agent:
User agent token: GPTBot
Full user-agent string: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)
웹 사이트 소유자는 파일을 통해 웹 페이지 인덱싱을 제어 할 수 있습니다 robots.txt, 다른 회사의 다른 웹 크롤러와 동일한 지침을 활용합니다.
예를 들어, 웹 사이트의 소유자가 OpenAi가 사이트에서 정보를 수집하기를 원하지 않으면 추가 할 수 있습니다. robots.txt 라인 :
User-agent: GPTBot
Disallow: /
Crawler 웹처럼 행동하더라도 GPTBOT는 공개적으로 이용 가능한 데이터를 수집하는 동시에 Paywall과 관련된 출처를 신중하게 피하고 공개 정책을 위반하는 개인 데이터 또는 콘텐츠를 수집하는 것입니다.
그러나 많은 논란이 있습니다. 일부는 기밀성의 주제와 저자의 동의없이 또는 출처를 피우지 않고 콘텐츠 사용에 대해 OpenAI에 대한 법적 조치를 불러 일으켰습니다.
6 월, 일본의 개인 정보 보호 규제 당국은 무단 데이터 수집에 대한 OpenAI에 대한 경고를 발표했습니다. 또한 올해 초 이탈리아는 유럽 연합 법률 위반으로 인해 Chatgpt의 사용을 일시적으로 금지했습니다.