久久av综合,激情婷婷欧美,自拍自偷一区二区三区,久久精品免费一区二区三区

首頁 > 新車性能 > 新車性能 > 深夜開源首個萬億模型K2,壓力給到OpenAI,Kimi時刻要來了?

深夜開源首個萬億模型K2,壓力給到OpenAI,Kimi時刻要來了?

發布時間:2025-07-15 00:08:55來源: 13566779980

沒想到,Kimi 的首個基礎大模型開源這么快就來了。

昨晚,月之暗面正式發布了 Kimi K2 大模型并開源,新模型同步上線并更新了 API,價格是 16 元人民幣 / 百萬 token 輸出。

這次發布趕在了最近全球大模型集中發布的風口浪尖,前有 xAI 的 Grok 4,下周可能還有谷歌新 Gemini 和 OpenAI 開源模型,看起來大模型來到了一個新的技術節點。或許是感受到了 Kimi K2 的壓力,就在剛剛,奧特曼發推預告了自家的開源模型。不過,網友似乎并不看好。

本次開源的共有兩款模型,分別是基礎模型 Kimi-K2-Base 與微調后模型 Kimi-K2-Instruct,均可商用

  • 博客鏈接:https://moonshotai.github.io/Kimi-K2/
  • GitHub 鏈接:https://github.com/MoonshotAI/Kimi-K2

根據 Hugging Face 頁面數據顯示,Kimi K2 的下載量在前 20 分鐘便接近了 12K。

從 LiveCode Bench、AIME2025 和 GPQA-Diamond 等多個基準測試成績來看,此次 Kimi K2 超過了 DeepSeek-V3-0324、Qwen3-235B-A22B 等開源模型,成為開源模型新 SOTA;同時在多項性能指標上也能趕超 GPT-4.1、Claude 4 Opus 等閉源模型,顯示出其領先的知識、數學推理與代碼能力。

Kimi 展示了 K2 的一些實際應用案例,看起來它能自動理解如何使用工具來完成任務。它可以自動地理解所在的任務環境,決定如何行動,在下達任務指令時,你也不需要像以往那樣為智能體列出詳細的工作流程。

在完成復雜任務工作時,Kimi K2 會自動調用多種工具實現能力邊界的擴展。昨天上線后,網友們第一時間嘗試,發現可以實現不錯的效果:

值得關注的是,就在昨天 Grok 4 發布后,人們第一時間測試發現其代碼能力飄忽不定,但看起來 Kimi K2 的代碼能力經住了初步檢驗。

網友使用 Claude Code 鏈接 Kimi K2,發現效果不錯。

從網友第一時間的測試來看,K2 代碼能力是個亮點,因為價格很低,大家發現它可能是 Claude 4 Sonnet 的有力開源平替。有網友直接說 K2 是代碼模型的 DeepSeek 時刻:

HuggingFace 聯合創始人 Thomas Wolf 也表示,K2 令人難以置信,開源模型正在挑戰最新的閉源權重模型。

在技術博客中,Kimi 也介紹了 K2 訓練中的一些關鍵技術。

預訓練數據 15.5T tokens

沒用傳統 Adam 優化器

首先,為了解決萬億參數模型訓練中穩定性不足的問題,Kimi K2 引入了 MuonClip 優化器

Muon 優化器作為一種優化算法,可以幫助神經網絡在訓練過程中更好地收斂,提升模型準確性和性能。今年 2 月,月之暗面推出了基于 Muon 優化器的高效大模型 Moonlight,證明這類優化器在 LLM 訓練中顯著優于當前廣泛使用的 AdamW 優化器。

此次,Kimi K2 在開發過程中進一步擴展 Moonlight 架構。其中基于 Scaling Laws 分析,月之暗面通過減少 Attention Heads 數量來提升長上下文效率,同時增加 MoE 稀疏性來提高 token 利用效率。然而在擴展中遇到了一個持續存在的挑戰:Attention logits 爆炸會導致訓練不穩定,而 logit 軟上限控制和 query-key 歸一化等現有方案對此的效果有限。

針對這一挑戰,月之暗面在全新的 MuonClip 中融入了自己提出的 qk-clip 技術,在 Muon 更新后直接重新縮放 query 和 key 投影組成的權重矩陣,從源頭上控制 Attention logits 的規模,實現穩定的訓練過程。

改進后的 MuonClip 優化器不僅可以擴展到 Kimi K2 這樣萬億參數級別的 LLM 訓練,還將大幅度提升 token 效率。一個更具 token 效率的優化器更能提升模型智能水平,這正是當前業界(如 Ilya Sutskever)看重的延續 Scaling Laws 的另一關鍵系數。

Kimi K2 的實驗結果證實了這一點:MuonClip 能夠有效防止 logit 爆炸,同時保持下游任務的性能。官方稱,Kimi K2 順利完成 15.5T tokens 的預訓練,過程中沒有出現任何訓練尖峰,形成了 LLM 訓練的一套新方法。

token 損失曲線

因此,相較于原始 Muon,MuonClip 取長補短,進一步放大其在預訓練過程中的優勢。自大模型技術爆發以來,優化器的探索方向不再是熱門,人們習慣于使用 Adam,而如果想要進行替換,則需要大量的驗證成本。Kimi 的全新探索,不知是否會成為新的潮流。

其次,為了解決真實工具交互數據稀缺的難題,Kimi K2 采用大規模 Agentic 數據合成策略,并讓模型學習復雜工具調用(Tool Use)能力

本周四,我們看到 xAI 的工程師們在發布 Grok 4 時也強調了新一代大模型的多智能體和工具調用能力,可見該方向正在成為各家公司探索的焦點。

Kimi 開發了一個受 ACEBench 啟發的綜合 pipeline,能夠大規模模擬真實世界的工具使用場景。具體來講,該流程系統性地演化出涵蓋數百個領域的數千種工具,包括真實的 MCP 工具和合成工具,然后生成數百個具有多樣化工具集的智能體。

大規模 Agentic 數據合成概覽

接下來,這些智能體與模擬環境、用戶智能體進行交互,創造出逼真的多輪工具使用情景。最后,由一個大語言模型(LLM)充當評判員,根據任務評分標準(rubrics)評估模擬結果,篩選出高質量的訓練數據。

一整套流程走下來,這種可擴展的 pipeline 生成了多樣化、高質量的數據,有效填補特定領域或稀缺場景真實數據的空白。并且,LLM 對數據的評估與篩選有效減少低質量數據對訓練結果的負面影響。這些數據層面的增強為大規模拒絕采樣和強化學習鋪平了道路。

最后,Kimi K2 引入了通用強化學習(General RL),通過結合 RL 與自我評價(self-judging)機制,在可驗證任務與不可驗證任務之間架起了一座橋梁

在數學、編程等可驗證任務上,我們可以根據正確答案、任務完成情況等可驗證的獎勵信號持續更新并改進對模型能力的評估。但是,傳統強化學習由于依賴明確的反饋信號,因而在生成文本、撰寫報告等不可驗證任務中很難給出客觀、即時的獎勵。

針對這一局限,通用強化學習通過采用自我評價機制,讓模型充當自己的評判員(critic),提供可擴展、基于 rubrics 的反饋。這種反饋替代了外部獎勵,解決了不可驗證任務中獎勵稀缺的問題。 與此同時,基于可驗證獎勵的策略回滾(on-policy rollouts),持續對評判員進行更新,使其不斷提升對最新策略的評估準確性。

這種利用可驗證獎勵來改進不可驗證獎勵估計的方式,使得 Kimi K2 既能高效地處理傳統可驗證任務,又能在主觀的不可驗證任務中自我評估,從而推動強化學習技術向更廣泛的應用場景擴展。

從長遠來看,Kimi K2 的這些新實踐讓大模型具備了在各種復雜環境中持續優化的能力,可能是未來模型智能水平繼續進化的關鍵。

接下來,基模卷什么

Kimi 的發布,讓我們想起前天 xAI 的 Grok-4 發布會,馬斯克他們宣傳自己大模型推理能力時,列出了基于通用 AI 難度最高的測試「人類最后的考試」Humanities Last Exam(HLE)上幾個重要突破節點。

其中 OpenAI 的深度研究、Gemin 2.5 Pro 和 Kimi-Reseracher 都被列為了重要的突破:

Kimi-Researcher 在上個月剛剛發布,其采用端到端自主強化學習,用結果驅動的算法進行訓練,擺脫了傳統的監督微調和基于規則制或工作流的方式。結果就是,探索規劃的步驟越多,模型性能就越強。

而在 Kimi K2 上,月之暗面采用了與 Grok 4 類似的大規模工具調用方式。

另外,我們可以看到,由于國內算力資源的緊缺局面,新一波大模型技術競爭已經逐漸放棄單純的堆參數、算力規模擴大的方式,在推動模型 SOTA 的過程中,通過算法上的創新來卷成本和效率成為趨勢。

新車性能更多>>

紅旗天工05/06 800V超充破局補能焦慮,國風美學+全場景智駕,15-20萬級純電標桿實至名歸 17.18萬元起 紅旗天工05/06 800V超充版正式上市 新增云夢銀車色 魏牌V9X正式開啟預售 預售價區間37.18萬-41.18萬元 方程豹的 “多元宇宙”大概率會搭載 800V 高壓平臺與 4C 閃充技術,成為方程豹高性能基因的新載體 大眾CEA量產實測車隊解析 消費者視角評論 預售11.28-14.28萬的銀河星耀7,一篇文章搞懂核心競爭力 奧迪A6L e-tron與Q6L e-tron家族攜手亮相,豪華電動時代正當時 寶馬中國一季度再跌10%,從降價到換帥,新世代車型能否扭轉乾坤? 旗艦大滿配,不做選擇題!智己LS8上市,24.98萬元起 埃安N60預售11.58萬起,它如何重新定義家用好車? 金標大眾與眾08導購:三款車型怎么選更合適 新款豐田Yaris Cross官圖,“八字胡”成為過去式 深藍汽車已經通過用戶服務月的“五大主動”,開啟了從規模擴張到價值經營的轉身 動如疾“風” 靜臥“云”端 風云T9L九大越級僅12.99萬元起 不做選擇題的年輕人,能讓15萬級SUV市場卷出新高度嗎? 本田Prelude,矛盾重重但又棄之可惜的雙門小跑 售價區間12.99-18.69萬元 搭載鯤鵬超能電混CDM6.0 奇瑞風云T9L正式上市 廣汽以星源插混、星源超級雙擎(HEV+)為核心,疊加星源增程構建全域動力矩陣,重構混動行業新標桿 13.38萬,歐拉5限定版憑什么讓99臺車1分28秒賣光? 30分鐘沒廢話 東風日產這次把發布會開成了“爽文” 馮長軍:汽車設計是品牌靈魂的直觀體現 嵐圖汽車為上海交大和西安交大校慶提供出行保障 深度試駕沃爾沃XC90 T8:是不是新能源不重要,重要的是腔調 濟南展看麗馳:四大展區全系車型深度解析,三大核心技術引爆全場 3月份出口量“炸場”,中國汽車出海按下加速鍵 20萬級家用MPV破局者:江淮瑞風RF8悅享系列 重新定義全家舒適出行 尚界新車挑戰小米SU7, “全系滿配”能否后來居上? 比亞迪如何用12年啃下新加坡這塊“硬骨頭”? 純電SUV埃安N60即將迎來上市,新車定于4月16日開啟預售 3月交付同比漲136%,是時候重估蔚來價值了
久久av综合,激情婷婷欧美,自拍自偷一区二区三区,久久精品免费一区二区三区
中文字幕成在线观看| 国产精品自拍区| 欧美xxxx中国| 欧美日韩尤物久久| 99精品小视频| 久久亚洲国产| 免费观看久久av| 综合五月婷婷| 国产精品99久久免费| 欧美aa在线观看| 亚洲黄页一区| 国产日韩免费| 日韩国产欧美一区二区| 国产一区二区高清| 成人国产精品一区二区网站| 亚洲先锋成人| 日韩午夜视频在线| 久久久久久婷| 中文精品视频| 激情综合网五月| 亚洲欧美日本国产| 日韩国产在线观看一区| 日韩黄色大片网站| 伊人影院久久| 日本天堂一区| 欧美一级鲁丝片| 另类av一区二区| 久久99久久人婷婷精品综合| 日本美女一区| 亚洲精品无吗| 97人人精品| 亚洲婷婷丁香| 国产一区不卡| 在线亚洲欧美| 国产精品精品国产一区二区| 视频在线观看一区二区三区| 久久国产免费看| 91精品啪在线观看国产18| 色狠狠一区二区三区| 日韩在线高清| 亚洲欧美日韩国产一区二区| 风间由美中文字幕在线看视频国产欧美| 99视频在线精品国自产拍免费观看| 欧美激情视频一区二区三区免费 | 日韩成人av影视| 四虎4545www国产精品| 热久久久久久| 激情91久久| 精品国产亚洲一区二区在线观看| 国产在线日韩| 精品国产午夜| 日韩欧美美女在线观看| 精品一区在线| 黄色网一区二区| 视频一区日韩| 影音先锋国产精品| 成人影视亚洲图片在线| 911亚洲精品| 欧美特黄一区| 欧美sss在线视频| 国产成人精品免费视| 青青草精品视频| 免费看精品久久片| 在线视频观看日韩| 久草精品视频| 国产精品中文| 日韩高清一区| 免费在线观看视频一区| 五月婷婷亚洲| 婷婷精品视频| 91精品精品| 欧洲亚洲一区二区三区| 97国产成人高清在线观看| 久久爱www成人| 欧美在线黄色| 国产欧美一区| 国产欧美一区二区三区精品观看| 亚洲欧美视频| 九九在线精品| 亚洲二区视频| 久久中文字幕导航| 国产一级成人av| 涩涩涩久久久成人精品| 亚洲在线久久| 中文字幕免费一区二区| 久久av在线| 亚洲免费高清| 午夜欧美精品久久久久久久| 欧美成人高清| 亚洲国产一区二区在线观看| 亚洲韩日在线| 最新日韩av| 性色一区二区| 日韩精品一二三区| 丝袜美腿一区二区三区| 欧美中文日韩| 中文字幕亚洲在线观看| 日韩激情啪啪| 国产精品一区二区三区av麻| 国产乱人伦丫前精品视频 | 国产综合激情| 午夜视频精品| 欧美专区在线| 日韩精品一区二区三区免费视频| 日韩高清成人在线| 久久国产免费看| 国产高清精品二区| 久久99高清| 精品网站999| 日本精品不卡| 午夜在线观看免费一区| 色综合视频一区二区三区日韩 | 91一区二区| 日韩欧美一区二区三区在线观看| 91精品国产成人观看| 欧美影院三区| 一区二区三区四区日韩| 日本视频一区二区| 国产精品不卡| 免费久久久久久久久| 亚洲精品免费观看| 精品久久影院| 丝袜av一区| 亚洲图片久久| 精品中国亚洲| 不卡一区综合视频| 日韩午夜视频在线| 国产成人精品一区二区三区视频 | 国产欧美欧美| 色黄视频在线观看| 亚洲深爱激情| 91精品国产一区二区在线观看| 精品一区二区三区中文字幕| 久久久久久久久久久妇女| 亚洲伊人精品酒店| 福利欧美精品在线| 亚洲一区二区三区无吗| 免费一区二区三区在线视频| 久久婷婷亚洲| 日韩精品导航| 亚洲va在线| 国产伦精品一区二区三区在线播放 | 欧美在线观看视频一区| 日韩有吗在线观看| 高潮久久久久久久久久久久久久| 欧美天堂视频| 热久久久久久| 国产高清久久| 午夜电影亚洲| 播放一区二区| 国产精品色婷婷在线观看| 石原莉奈在线亚洲二区| 麻豆精品在线观看| 99精品美女| 综合一区av| 香蕉视频成人在线观看| 五月天综合网站| 日韩在线观看一区二区三区| 中文视频一区| 久久美女性网| 激情五月综合网| 国产精品porn| 国产精品久久久久久av公交车| 国产精品黑丝在线播放| 韩国久久久久久| 日本不卡一二三区黄网| 日韩大片免费观看| 男人的天堂亚洲一区| 久久精品国产福利| 喷白浆一区二区| 久久久久久色 | 在线日韩电影| 国产精品一区二区三区av| 国产精品一区二区免费福利视频| 日韩久久一区| 国产夫妻在线| 久久不见久久见国语| 亚洲一级网站| 麻豆久久一区二区| 日本精品久久| 亚洲ab电影| 人人精品人人爱| 天使萌一区二区三区免费观看| 亚洲综合福利| 免费高清在线一区| 一区二区电影| 在线综合亚洲| 日本久久二区| 国产精品17p| 成人日韩av| 亚洲高清av| 亚洲综合精品四区| 亚洲精品一区二区在线看| 视频一区视频二区中文| 欧美少妇精品| 欧美sm一区| 在线日韩中文| 麻豆视频久久| 亚洲电影在线| 精品久久久中文字幕|