亚洲午夜日韩高清一区,国产日韩欧美视频在线观看,亚洲精品高清国产一久久

OpenAI推出由o3驅(qū)動的全新“深度研究”模式，展現(xiàn)了AI代理時代的力量

責(zé)任編輯：cres

作者：Carl Franzen

2025-02-05 15:17:06

來源：企業(yè)網(wǎng)D1Net

原創(chuàng)

OpenAI宣布推出“Deep Research”模式，專為ChatGPT Pro訂閱用戶設(shè)計，該AI工具能深入廣泛研究網(wǎng)絡(luò)特定主題，匯編高質(zhì)量報告，涵蓋商業(yè)、科學(xué)、醫(yī)學(xué)等多個領(lǐng)域，為用戶節(jié)省大量時間。

如果你因為關(guān)注格萊美獎而錯過了這一消息，那么讓我來告訴你：OpenAI在周日晚間宣布推出其新的“Deep Research(深度研究)”模式，令全世界為之震驚，這是一項面向ChatGPT Pro訂閱計劃(200美元/月)用戶的AI工具，旨在通過深入且廣泛地研究網(wǎng)絡(luò)上的特定主題，并匯編出涵蓋商業(yè)、科學(xué)、醫(yī)學(xué)、營銷等多個專業(yè)領(lǐng)域的高質(zhì)量報告，從而為用戶節(jié)省數(shù)小時的時間。

美國的ChatGPT Pro(以及即將推出的ChatGPT Plus、Team、Enterprise和Edu)用戶將能夠通過點擊ChatGPT網(wǎng)站和應(yīng)用程序底部提示輸入/撰寫欄下方的選項來訪問Deep Research。

OpenAI的CEO Sam Altman在其個人社交網(wǎng)絡(luò)X賬號上發(fā)布的一系列帖子中描述這一功能“如同超能力，隨叫隨到的專家!”他補充道，“它真的非常出色，能夠完成那些需要數(shù)小時/數(shù)天并花費數(shù)百美元的任務(wù)。”

Deep Research基于OpenAI的O系列推理模型，特別是即將發(fā)布的完整o3模型(一個更小、功能較弱的o3-mini模型已于1月31日推出)。完整的o3模型能夠分析大量信息，并將文本、PDF和圖像整合成一個連貫的分析。

在YouTube上發(fā)布的直播中，OpenAI前沿研究負(fù)責(zé)人Mark Chen解釋稱，Deep Research能夠在“互聯(lián)網(wǎng)上進(jìn)行多步驟研究，它發(fā)現(xiàn)內(nèi)容、合成內(nèi)容并對這些內(nèi)容進(jìn)行推理，隨著發(fā)現(xiàn)越來越多的信息，不斷調(diào)整其計劃。”

Chen還強(qiáng)調(diào)了這項創(chuàng)新對于OpenAI愿景的重要性：“這是我們AGI路線圖的核心，我們的最終目標(biāo)是打造一個能夠自行發(fā)現(xiàn)和探索新知識的模型。”

Deep Research的推出是OpenAI官方工具中的第二個，此前本月早些時候已推出了瀏覽器和光標(biāo)控制工具Operator。OpenAI Stargate Command任務(wù)對齊負(fù)責(zé)人Joshua Achiam在X上寫道，這兩個模型都有助于更好地定義“AI工具”的概念——這是一個當(dāng)前在企業(yè)中流行但模糊不清的術(shù)語——其意義遠(yuǎn)超公司或這些特定用例。

“我覺得‘工具’這個詞在沙漠里徘徊了一段時間，”Achiam寫道，“它沒有基礎(chǔ)或示例可以指向，但Operator或Deep Research等工具為這個概念賦予了一定的形態(tài)。一個工具是一個GenAI，它為你執(zhí)行一個或多個使用工具的工作流。”

OpenAI的Deep Research在“人類最后一場考試”AI基準(zhǔn)測試中取得新最高分

Deep Research在準(zhǔn)確性和推理方面樹立了新的基準(zhǔn)。

OpenAI研究團(tuán)隊成員Isa Fulford在YouTube直播中分享稱，該模型在“人類最后一場考試”中取得了“26.6%準(zhǔn)確率的新高”。“人類最后一場考試”是一個相對較新的AI基準(zhǔn)測試，旨在成為任何AI模型(或人類)最難完成的測試，涵蓋100個不同領(lǐng)域的3000個問題，如翻譯考古發(fā)現(xiàn)上的古代銘文。

此外，其瀏覽網(wǎng)頁、動態(tài)推理和精確引用來源的能力使其區(qū)別于早期的AI工具。

“該模型是在困難的瀏覽和推理任務(wù)上通過端到端的強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練的，”Fulford說，“它學(xué)會了規(guī)劃和執(zhí)行多步驟軌跡，對實時信息做出反應(yīng)，并在必要時回溯。”

Deep Research的一個突出特點是其處理任務(wù)的能力，這些任務(wù)否則可能需要人類花費數(shù)小時甚至數(shù)天的時間。

在宣布時，Chen解釋說，“Deep Research生成的輸出類似于一篇全面、充分引用的研究論文——這是該領(lǐng)域的分析師或?qū)＜铱赡軙a(chǎn)出的內(nèi)容。”

應(yīng)用場景和用例

Deep Research的應(yīng)用場景既多樣又具有影響力。

OpenAI的官方X賬號發(fā)布稱，它是“為在金融、科學(xué)、政策和工程等領(lǐng)域從事密集知識工作并需要徹底和可靠研究的人員而構(gòu)建的。”

根據(jù)OpenAI在其官方Deep Research宣布博客文章(其中包括對某人購買的最佳滑雪板的詳細(xì)研究評估)中分享的示例，對于尋求個性化推薦或進(jìn)行詳細(xì)產(chǎn)品研究的消費者來說，它也顯得很有價值。

Altman總結(jié)了該工具的多樣性，他寫道：“在你最難的工作任務(wù)上試試它，這些任務(wù)只需通過互聯(lián)網(wǎng)就能解決，看看會發(fā)生什么。”

Deep Research的個人醫(yī)療成功案例

OpenAI政府市場拓展負(fù)責(zé)人Felipe Millon分享了一個關(guān)于Deep Research如何影響他家庭的深刻個人經(jīng)歷。他在X上的一系列帖子中寫道，他的妻子與雙側(cè)乳腺癌抗?fàn)帲@款A(yù)I工具成為了他們意想不到的盟友。

“10月底，我的妻子被診斷出患有雙側(cè)乳腺癌，”Millon寫道，“一夜之間，我們的世界天翻地覆。”

在經(jīng)過雙乳切除術(shù)和化療后，這對夫婦面臨了一個關(guān)鍵決定：是否進(jìn)行放射治療。情況充滿了不確定性，因為即使他們的專家也給出了不同的建議。“對于她的具體情況，完全處于灰色地帶，”Millon解釋說，“我們感到束手無策。”

由于提前獲得了Deep Research的預(yù)覽訪問權(quán)限，Millon決定上傳妻子的手術(shù)病理報告，并詢問放射治療是否會有益。他寫道，“接下來發(fā)生的事情令人震驚。它不僅確認(rèn)了我們腫瘤學(xué)家提到的內(nèi)容——而且更深入。它引用了我從未聽說過的研究，并在我們補充了她的年齡和遺傳因素等細(xì)節(jié)后進(jìn)行了調(diào)整。”

他使用的具體提示是：

“閱讀附帶的手術(shù)病理報告，其中包含關(guān)于雙側(cè)乳腺癌的信息。然后研究[判斷]對于該患者在6輪TCHP化療后，根據(jù)其乳腺癌類型，是否建議進(jìn)行放射治療。我想了解該患者進(jìn)行放射治療的利弊，它降低復(fù)發(fā)可能性的概率，以及益處是否大于潛在的長期風(fēng)險。”

Millon和他的妻子核實了模型引用的每一項研究，發(fā)現(xiàn)它們準(zhǔn)確且高度相關(guān)。“我們很快就要去看另一位專家了，但我們已經(jīng)對自己的決定更有信心了，”他寫道，“它在我們最需要的時候給了我們安心。”

可用性和下一步計劃?

Deep Research目前可供ChatGPT Pro用戶使用，計劃擴(kuò)展到Plus和Team層級，隨后是Enterprise和教育市場。

正如Chen所警告的，“它仍然有可能產(chǎn)生幻覺，所以當(dāng)你制作報告時，一定要自己檢查來源。”

該模型長時間自主思考的能力也使其資源密集，OpenAI目前正在努力優(yōu)化其性能，以提高可訪問性。

OpenAI還暗示了未來將與自定義數(shù)據(jù)集進(jìn)行集成，這將使企業(yè)能夠利用該工具進(jìn)行專有研究。

對于Millon來說，Deep Research的影響已經(jīng)顯而易見。“我們經(jīng)常在OpenAI內(nèi)部談?wù)撃切┳屇?lsquo;感受到AGI’的時刻，而這就是其中之一，”他寫道，“這個東西將改變世界。”

企業(yè)網(wǎng)D1net(m.hfnxjk.com)：

國內(nèi)主流的to B IT門戶，旗下運營國內(nèi)最大的甲方CIO專家?guī)旌椭橇敵黾吧缃黄脚_-信眾智(www.cioall.com)。旗下運營19個IT行業(yè)公眾號(微信搜索D1net即可關(guān)注)。

版權(quán)聲明：本文為企業(yè)網(wǎng)D1Net編譯，轉(zhuǎn)載需在文章開頭注明出處為：企業(yè)網(wǎng)D1Net，如果不注明出處，企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。

AI OpenAI