在用V3和R1模型橫掃硅谷、引爆全球科技圈后,DeepSeek在除夕這天繼續放大招。
1月28日凌晨,人工智能社區Hugging Face顯示,DeepSeek發布了開源多模態模型Janus-Pro,擁有10億和70億參數規模,相比此前的語言和推理模型,本次發布的新模型重點在于文生圖能力方面。
根據DeepSeek的技術文檔,這個模型既能讓AI讀圖,又能讓AI生圖。在文生圖GenEval和DPG-Bench基準測試中,Janus-Pro-7B的準確率較前代Janus大幅提高,準確率測試結果分別為80%和84.2%,高于包括OpenAI DALL-E 3、Stable Diffusion在內的其他對比模型。
“他們真的想成為下一個 Grok(they really trying to be the next grok)。”針對DeepSeek的最新發布,有海外網友表示。此前由馬斯克創立的xAI發布了名為Grok的一系列模型和應用,此舉被視為對OpenAI等行業巨頭的直接挑戰。
DeepSeek的AI生圖和讀圖能力如何?
在外網,有網友測試了讀圖能力,表示Janus-Pro-7B的高精度讀圖能力很優秀,其發布的截圖顯示,在多行復雜數學表達式混合排版的圖片轉Latex代碼,以及手繪風格時序圖圖片轉mermaid代碼的測試中,都是通過一句話Prompt實現了讀圖。
上述網友表示,雖然在邏輯性更強的時序圖代碼上模型沒能一比一復刻原圖,有一些錯誤,但基于經驗判斷,通過稍微的提示調整或者配合類R1級別的模型就能解決。
在文生圖能力方面,有網友也第一時間進行了測試,從畫面美學和指令跟隨上看Janus-Pro接近目前的頭部模型水平。
根據技術文檔,在文本到圖像指令跟蹤排行榜 GenEval中,Janus-Pro-7B 得分為 0.80,優于 Janus (0.61)、DALL-E 3 (0.67) 和 Stable Diffusion 3 Medium(0.74)。另外,Janus-Pro 在 DPG-Bench 上獲得了 84.19 的分數,超過了所有其他方法。這表明 Janus-Pro 擅長遵循密集的指令來生成文本到圖像。
DeepSeek也對外展示了一些文生圖的案例,在畫面質量上表現優秀。
DeepSeek的熱度還在持續。1月27日,DeepSeek應用登頂蘋果中國地區和美國地區應用商店免費APP下載排行榜,在美區下載榜上超越了ChatGPT。這一紀錄持續到1月28日,截至記者發稿,DeepSeek仍霸榜中美蘋果應用商店排行榜,維持在免費榜第一的位置。
自去年底至今年初,DeepSeek接連發布重磅產品,關注度持續累積。
DeepSeek出圈是在12月26日,彼時官方宣布全新系列模型DeepSeek-V3上線并同步開源,隨后就刷屏了海外社交媒體平臺X,全球科技圈驚嘆的點在于,這一模型能力對標頭部模型,但訓練的預算卻非常低,“2048個GPU、2個月、近600萬美元”,相比之下,GPT-4o等模型的訓練成本約為1億美元,至少在萬個GPU量級的計算集群上訓練。
當時,Chatbot Arena數據顯示,DeepSeek-V3在所有模型中排名第七,在開源模型中排第一,是全球前十中性價比最高的模型。
“Llama 3 405B 使用了3080萬GPU小時,而DeepSeek-V3 看起來是一個更強大的模型,僅使用了280萬GPU 小時(計算量約為十分之一)?!鼻癘pen AI 聯合創始人、Tesla AI 團隊負責人Andrej Karpathy在X上發文表示,如果該模型的優良表現能夠得到廣泛驗證,這一模型將是在資源受限的情況下,在研究和工程方面讓人印象深刻的一次展示。
就在1月20日,DeepSeek又正式開源其推理模型R1。1月24日,DeepSeek-R1在Chatbot Arena綜合榜單上排名第三,與OpenAI的頂尖推理模型o1并列。在高難度提示詞、代碼和數學等技術性極強的領域,DeepSeek-R1拔得頭籌;在風格控制以及高難度提示詞與風格控制結合的測試中,DeepSeek-R1均與o1 并列第一。
DeepSeek以“低成本訓練”和“高性價比”為核心賣點,其API輸入價格僅為每百萬Token 0.1元人民幣,遠低于目前行業的頭部模型,例如Claude 3.5 Sonnet為3美元/百萬Token,這種低成本訓練策略也讓該公司有了“AI界拼多多”的稱號。
市場認為,DeepSeek的成功可能削弱了市場對英偉達AI芯片需求的預期,多家券商發布研報稱AI大模型的應用將逐步走向普惠,“低成本 高性能”大模型成為可能,這一趨勢一度引發英偉達等硬件廠商的股價暴跌。
截至周一收盤,英偉達收跌16.97%,市值蒸發近5900億美元,刷新美國金融史紀錄。在周一之前,美股個股歷史最大單日市值蒸發紀錄是英偉達在去年9月創造的2790億美元,再往前是2022年Meta大跌2320億美元。
除此之外,博通公司股價也下跌超17%,臺積電跌超13%,軟銀旗下的Arm Holdings跌超10%,AMD跌超6%,阿斯麥跌超5%。
當地時間1月27日晚,美國總統特朗普在佛羅里達州邁阿密發表講話,對中國人工智能初創公司DeepSeek攪動納斯達克一事表示,DeepSeek的模型高效且經濟,其出現是一種積極的發展,也“給美國相關產業敲響了警鐘”,美國“需要集中精力贏得競爭”。
幫企客致力于為您提供最新最全的財經資訊,想了解更多行業動態,歡迎關注本站。鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。