<ul id="i6e2g"><center id="i6e2g"></center></ul>
<ul id="i6e2g"></ul>

    幣圈網

    o3-pro正式推出!說聲“嗨”就花了80美元 思考1 1用時16分鐘

    OpenAI深夜放大招,正式推出“最新最強版”推理模型o3-pro!

    而且同一時間,o3模型降價80%不降智。

    官方測評結果顯示,在專家評估中,所有人一致更偏愛o3-pro而非o3的回答。

    此外,o3-pro也一舉超越o3、o1-pro,成為當前最擅長數學、科學和編程的OpenAI模型。

    OpenAI CEO奧特曼也第一時間激動表示:

    這真是太聰明了!我第一次看到它相對于o3的勝率時,簡直不敢相信。

    目前o3-pro已取代o1-pro,面向ChatGPT的Pro和Team用戶開放,Enterprise和Edu用戶將在下周獲得使用權限。

    而對開發者來說,o3-pro已經可以通過API接入:

    每百萬輸入tokens收費20美元(約合人民幣143元),每百萬輸出tokens收費80美元(約合人民幣574元)。

    有多貴呢?

    溫馨提醒,據稱一句簡單的“嗨”就花了網友80美元(doge)。

    或許OpenAI也意識到這個價格確實有點貴,所以另一邊趕緊宣布o3降價80%。

    o3降價80%不降智

    官網顯示,o3的最新API價格如下:

    每百萬輸入tokens收費2美元,每百萬輸出tokens收費8美元。

    對比o1-pro下降了80%以上,不僅是o3-pro的1/10,而且和GPT-4o(每百萬輸入/輸出分別為2.5美元和10美元)基本持平。

    至于降價原因,明面上的說法是OpenAI對推理服務架構進行了全面優化。

    就是說,雖然o3和o3-pro底層模型相同,但由于推理更高效,所以價格自然就下調了。

    不過,就在奧特曼對這一價格“沾沾自喜”時,關于o3“是否真的沒有降智”卻陷入了爭議。

    網友們也是相當直白,在奧特曼這條推文底下直接表達了懷疑:

    甚至有博主以親身經歷(暫無法確定真實性)出來發聲,認為o3在實測中變笨了。

    OpenAI降價并非出于慈善……

    然而這一說法也遭到了其他網友的反駁,總體來看目前對峙雙方并未就這一爭議拿出實質性證據。

    雖然爭議尚未討論出具體結果,但一些關于o3-pro的測試結果已經新鮮出爐。

    和開頭所提一致,官方在更嚴格的“4/4可靠性”評估中也驗證了o3-pro尤為擅長數學、科學和編程。

    p.s. 這項評估需要o3-pro在四次嘗試中(而不僅僅是一次,pass@1)正確回答問題~

    不過官方也多次提醒,由于o3-pro可以使用工具,因此響應時間通常比o1-pro更長。

    我們建議將其用于對可靠性要求更高的棘手問題,等待幾分鐘是值得的。

    這也和一眾網友實測下來的感受相符,o3-pro確實變強了,能夠解決一些其他模型無法答對的問題,不過由于響應變慢,價格也是真貴。

    HyperWriteAI CEO讓它思考“1 1=?”,結果往往需要耗時1分鐘以上(第一次問甚至用時16分鐘)。

    當然,這也恰好代表了o3-pro的錯誤打開方式。

    不論是官方建議還是一些好的網友實測結果,都說明o3-pro更適合挑戰一些有難度、有價值的問題。

    賓大教授Ethan Mollick分享了一個其他模型都曾鎩羽而歸的問題:從“SPACE”到“EARTH”制作一個單詞階梯。

    這個游戲需要模型從“SPACE”到“EARTH”,每次只改變一個字母,單詞真實有效且長度不變(右側為解釋“為什么這是一個合法的英語單詞”)。

    而o3-pro成功完成了挑戰,并且這不是模型通過聯網搜索得到的答案(即通過推理得到)。

    另一位生物醫學科學家也分享了與o3-pro合作開發免疫系統的例子。

    作為對比,他也向o3提出了同一任務(要求先識別出人類天然免疫系統的關鍵局限性),結果表明o3-pro更勝一籌。

    o3列出的前五個問題雖然強調了類似的重要問題,但后兩個問題無需徹底重構免疫系統即可解決。

    相比之下,o3-pro不僅提出了更多限制,而且它所指出的每一個限制都是極其關鍵、內在的問題,需要徹底重構。

    整體而言,通過ARC-AGI測試結果可以看到,o3-pro在高難任務上表現略好,但提升幅度不大,且成本隨難度上升。

    p.s. 這項測試主要考驗AI在面對新問題時的抽象推理和問題解決能力~

    奧特曼發小作文

    這是我最后一次在沒有任何人工智能幫助的情況下寫這樣的文章了。

    有意思的是,同一時間奧特曼也火速發了一篇小作文——

    題目為《The Gentle Singularity(溫和的奇點)》,來探討AI發展對人類社會的影響。

    其主要觀點包括下面這些:

    1、2025年,我們迎來了能夠真正進行認知工作的智能Agent,編寫計算機代碼的方式將徹底改變。2026年,我們很可能會看到能產生原創見解的系統;2027年,或許會出現能在現實世界中執行任務的機器人。

    2、到了2030年代,智慧和能源——即想法及實現想法的能力——將變得極其豐富。這兩者長期以來一直是人類進步的基本限制;如果智慧和能源變得充足(加上良好的治理),理論上我們可以實現一切。

    3、隨著數據中心的生產逐漸自動化,智能的成本最終應該會接近電力成本。(很多人關心ChatGPT每次查詢用多少能量;平均每次查詢大約耗電0.34瓦時,大概相當于烤箱運行一秒多一點,或高效燈泡使用幾分鐘。此外,每次查詢大約用水0.000085加侖,約等于十五分之一茶匙。)

    4、相比AI,人類有一個長期且重要的優勢:我們天生在意他人,以及他人怎么想、怎么做,而對機器卻沒什么感情。

    5、從相對論的角度看,奇點是一點點發生的,融合是逐步進行的。我們正攀登那條技術指數增長的長弧線;向前看總覺得是陡峭的垂直,向后看則像是平緩的線,但其實它是一條平滑的曲線。(回想2020 年,如果那時我們說2025年會接近 AGI,聽起來會很瘋狂,但對比過去五年所發生的一切,也許現在的預測不那么瘋狂了。)

    6、我們(整個行業,不只是OpenAI)正在為世界構建一個大腦,它的極限將取決于我們的好點子。

    7、OpenAI如今做的事情很多,但最根本的身份仍是一個超級智能研究公司。

    BTW,奧特曼最新推文有透露,原計劃中的公開權重模型要推遲了。

    嗯,又一個期貨(doge)~

    完整小作文地址如下:https://blog.samaltman.com/the-gentle-singularity

    參考鏈接:

    [1]https://x.com/OpenAI/status/1932530409684005048

    [2]https://x.com/OpenAIDevs/status/1932532777565446348

    [3]https://x.com/aidan_mclau/status/1932507602216497608[4]https://x.com/sama/status/1932547247243505924

    鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

    国产美女精品一区二区三区| 日韩一区二区三区射精| 999国产精品999久久久久久| 中文精品北条麻妃中文| 日本精品久久久久久久久免费| 国产农村乱子伦精品视频| 成人精品视频一区二区三区尤物 | 国产成人精品久久一区二区三区av| 国产在线精品一区在线观看| 多人伦精品一区二区三区视频| 亚洲日韩精品无码AV海量| 国产精品1024永久免费视频| 亚洲国产精品无码久久久| 精品无码人妻一区二区三区品 | 国产剧情精品在线观看| 精品伊人久久大香线蕉网站| 在线欧美精品一区二区三区| 国产成人精品男人的天堂538| 亚洲欧洲精品一区二区三区| 99久久亚洲精品无码毛片| 亚洲国产精品线在线观看| 久久99精品一久久久久久| 久久精品国产精品亚洲蜜月| 国产精品特级毛片一区二区三区| 亚洲精品亚洲人成在线观看| 国产亚洲精品AA片在线观看不加载| 精品国精品国产自在久国产应用男| 亚洲精品视频在线看| HEYZO无码综合国产精品227| 日本精品视频在线观看| 精品乱码一区内射人妻无码| 日韩a级一片在线观看| 精品视频一区二区三区在线播放| 日韩在线视频导航| 国产日韩在线观看视频网站 | 97久久精品一区二区三区 | 国产精品自在线天天看片 | 国产在视频线在精品| 日韩精品国产自在久久现线拍| 亚洲欧洲日韩国产综合在线二区| 日韩精品久久久肉伦网站|