明牌:OpenAI 發(fā)布帶有“身份標(biāo)識”的網(wǎng)絡(luò)爬蟲工具 GPTBot
2023-08-08 22:43:31 | 來源:亞匯網(wǎng) |
2023-08-08 22:43:31 | 來源:亞匯網(wǎng) |
(資料圖)
OpenAI表示,GPTBot使用專有網(wǎng)頁UA表示其爬蟲身份,完整UA字符串為(MozillaKHTML,likeGecko;compatible;GPTBot/1.0;+https:/gptbot),任何網(wǎng)站管理者都可以自由允許或阻止該爬蟲工具進(jìn)行數(shù)據(jù)采集。▲圖源OpenAI▲圖源OpenAIOpenAI聲稱,若網(wǎng)站管理員不希望被爬蟲搜集資料,管理員可以在網(wǎng)站服務(wù)器的robots.txt文件中完全禁止GPTBot抓取信息,或自行決定GPTBot抓取網(wǎng)站上的指定信息。OpenAI此前飽受業(yè)界對于“侵犯隱私問題”的指責(zé),當(dāng)下OpenAI推出這樣一套GPTBot爬蟲工具,可謂是其對于外界批判作出的相應(yīng)回應(yīng),同時(shí)也能夠推動(dòng)行業(yè)建立AI訓(xùn)練用爬蟲工具相關(guān)基準(zhǔn)。亞匯網(wǎng)此前報(bào)道,廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,亞匯網(wǎng)所有文章均包含本聲明。