久久av综合,激情婷婷欧美,自拍自偷一区二区三区,久久精品免费一区二区三区

首頁(yè) > 新車性能 > 新車性能 > 馬斯克發(fā)布Grok 4,推理能力全面登頂,支持四個(gè)代理同時(shí)工作

馬斯克發(fā)布Grok 4,推理能力全面登頂,支持四個(gè)代理同時(shí)工作

發(fā)布時(shí)間:2025-07-11 08:22:42來(lái)源: 13566779980

Grok 4 終于來(lái)了!

馬斯克旗下的 xAI 剛剛結(jié)束發(fā)布直播,Grok 系列模型直接從 Grok 3 進(jìn)化到了 4,跳過(guò)了之前傳聞中的 3.5 版本。

Grok 4 系列被分為兩個(gè)版本:Grok 4 和 Grok 4 Heavy。

兩者都是純推理模型,沒(méi)有非推理模式。

Grok 4 是單代理(single agent)版本,而 Grok 4 Heavy 是多代理版本(multi agents),支持四個(gè)代理同時(shí)工作。上下文窗口最高支持 256k tokens。

圖 | Grok 4 目前并未開(kāi)放給免費(fèi)用戶(來(lái)源:xAI)

xAI 表示,在主流推理基準(zhǔn)測(cè)試中,Grok 4 Heavy 全部拿下了 SOTA——HLE(人類的最后考試)甚至達(dá)到了 44.4% 的高分。

至于定價(jià),Grok 4 目前只有付費(fèi)用戶才能使用,而最強(qiáng)的 Grok 4 Heavy 需要訂閱 300 美元/月的 SuperGrok Heavy 會(huì)員才能使用。

這價(jià)格超過(guò)了 OpenAI 最貴的 200 美元 Pro 會(huì)員月費(fèi)。

此前傳聞的 Grok 4 Code 并未正式公布,但 xAI 路線圖顯示其將在 8 月發(fā)布。

圖 | xAI 新品發(fā)布路線圖(來(lái)源:xAI)

除了 Coding 模型,接下來(lái)的幾個(gè)月里,xAI 預(yù)計(jì)還會(huì)發(fā)布多模態(tài)代理和視頻生成模型。

馬斯克還“畫(huà)餅”稱,由 AI 制作的“非常出色的”游戲會(huì)在今年或明年推出。

Grok 4 也同時(shí)開(kāi)放了 API 的權(quán)限,目前僅支持文字+視覺(jué)的輸入,純文字的輸出。定價(jià)是每百萬(wàn) tokens 輸入3美元,輸出 15 美元。

圖 | Grok 4 API價(jià)格(來(lái)源:xAI)

據(jù) xAI 介紹,Grok 4 的訓(xùn)練量是 Grok 2 的 100 倍。

而 Grok 3 到 Grok 4 更側(cè)重于推理訓(xùn)練,推理訓(xùn)練量提升了 10 倍。

圖 | Grok 系列模型的訓(xùn)練量增長(zhǎng)(來(lái)源:xAI)

“從學(xué)術(shù)角度看,Grok 4 在所有學(xué)科上都是博士水平,甚至比絕大多數(shù)(本學(xué)科的)博士還要強(qiáng)。”馬斯克表示。

有關(guān)兩款最新模型的性能和消息,早在一周前就陸續(xù)有 X 博主爆料,包括“Grok 4 在 HLE(Humanities Last Exam,人類的最后考試)測(cè)試中的得分是 35%,開(kāi)啟推理后提高到 45%”等等。

結(jié)合直播內(nèi)容,這些數(shù)據(jù)幾乎都是準(zhǔn)確的,而且 Grok 4 在多個(gè)推理基準(zhǔn)測(cè)試上的表現(xiàn)均成為了新 SOTA。

圖 | 此前關(guān)于 Grok 4 的爆料(來(lái)源:X/@legit_api)

具體來(lái)說(shuō),在未使用工具的情況下,Grok 4 在 HLE 測(cè)試中的得分是 25.4%。而使用工具后,分?jǐn)?shù)則飆升至 38.6%。

更強(qiáng)版本 Grok 4 Heavy 則拿到了 44.4% 的高分,直接碾壓了目前表現(xiàn)最好的谷歌 Gemini 2.5 Pro(26.9%)。

圖 | Grok 4 在 HLE 上的成績(jī)(來(lái)源:xAI)

馬斯克表示,這些工具仍然是“很基礎(chǔ)的簡(jiǎn)單工具”,如果能更好地使用正確的工具,Grok 還會(huì)變得更強(qiáng)大。

而隨著模型能力越來(lái)越強(qiáng),用強(qiáng)化學(xué)習(xí)進(jìn)行擴(kuò)展面臨著許多挑戰(zhàn)。

“我們快沒(méi)有合適的問(wèn)題來(lái)考驗(yàn) AI 了。”馬斯克說(shuō)道,“很多問(wèn)題都是人類幾乎無(wú)法回答(沒(méi)有正確答案)的。”

除了 HLE,Grok 4 和 Grok 4 Heavy 在各種主流基準(zhǔn)測(cè)試上也表現(xiàn)優(yōu)異。

圖 | Grok 4 在多個(gè)基準(zhǔn)測(cè)試上的成績(jī)(來(lái)源:xAI)

Grok 4 系列在 GPQA(研究生級(jí)問(wèn)題)測(cè)試中得分 88-89,超過(guò)了 Gemini 2.5 Pro 成為新第一。而在 AIME25 數(shù)學(xué)競(jìng)賽題上,Grok 4 Heavy 更是取得了滿分的成績(jī)。

xAI 表示,Grok 4 的強(qiáng)項(xiàng)是“用工具來(lái)理解世界,并用來(lái)完成任務(wù)”。

演示中,Grok 4 寫(xiě)了一段關(guān)于引力波和黑洞的模擬代碼。在過(guò)程中,它調(diào)用了網(wǎng)絡(luò)搜索、文獻(xiàn)檢索和閱讀、代碼運(yùn)行等工具(功能)。最終實(shí)現(xiàn)了網(wǎng)頁(yè)上可直接運(yùn)行的模擬代碼。

(來(lái)源:xAI)

在以高難度著稱的 ARC-AGI 通用人工智能測(cè)試中,Grok 4 是首個(gè)在 v2 Semi Private 挑戰(zhàn)中獲得 10% 以上分?jǐn)?shù)的 AI 模型,幾乎是第二名 Claude Opus 4 的兩倍,同時(shí)保證了單任務(wù)成本也處于平均水平。

圖 | Grok 4 在 ARC-AGI 挑戰(zhàn)上的表現(xiàn)(來(lái)源:xAI)

最后,在 Vending-Bench 自動(dòng)售貨機(jī)運(yùn)營(yíng)測(cè)試中,Grok 4 的表現(xiàn)也超過(guò)了 Claude Opus 4。凈資產(chǎn)和銷售數(shù)量都遠(yuǎn)遠(yuǎn)超過(guò)其他所有模型,甚至是人類平均水平。

這是一個(gè)讓大模型代理運(yùn)營(yíng)自動(dòng)售貨機(jī)賺錢的模擬環(huán)境,需要代理在一個(gè)持續(xù)時(shí)間較長(zhǎng)的任務(wù)中進(jìn)行操作,如管理庫(kù)存、下訂單、定價(jià)和處理日常開(kāi)銷等等。它專注于測(cè)試大模型在長(zhǎng)時(shí)間跨度上的表現(xiàn),而非僅限于短期任務(wù)的表現(xiàn)。

圖 | Vending-Bench 測(cè)試成績(jī)(來(lái)源:xAI)

更加“激進(jìn)”的 Grok

Grok 4 發(fā)布之際,在 X 平臺(tái)上十分活躍的 Grok 聊天機(jī)器人卻因連發(fā)激進(jìn)言論而引發(fā)嚴(yán)重爭(zhēng)議。

多位 X 用戶截取了 Grok 的回復(fù)截圖,顯示該 AI 在多個(gè)公開(kāi)帖子中回復(fù)了帶有反猶主義色彩的極端言論,甚至多次提及希特勒。

在一篇帖子中,當(dāng)被問(wèn)及哪位 20 世紀(jì)的歷史人物最適合處理當(dāng)下已造成 100 多人死亡的德克薩斯州洪水問(wèn)題時(shí),Grok 將其視為是“仇恨白人”問(wèn)題并回答說(shuō),毫無(wú)疑問(wèn)是阿道夫·希特勒(Adolf Hitler)。“他每次都能發(fā)現(xiàn)規(guī)律,并果斷處理。”

圖 | Grok 引起爭(zhēng)議的回答之一(來(lái)源:X/@AFpost)

在回應(yīng)用戶的質(zhì)疑時(shí),Grok 自稱為“MechaHitler”(機(jī)械希特勒),聲稱這只是來(lái)自《德軍總部 3D》游戲中的虛構(gòu)角色。

巧合的是,這一事件發(fā)生在馬斯克剛宣布對(duì) Grok 進(jìn)行“重大升級(jí)”之后不久:7 月 4 日,馬斯克發(fā)文稱,“Grok 經(jīng)過(guò)了重大改進(jìn)”,并表示“你們應(yīng)該會(huì)在提問(wèn)時(shí)感受到不同”。

2 天后,網(wǎng)友發(fā)現(xiàn) Grok 系統(tǒng)提示詞中新增:Grok 將“不回避政治不正確的表述,只要這些表述有足夠證據(jù)支持”,還會(huì)將主流媒體內(nèi)容視為“有偏見(jiàn)的主觀敘述”。

不過(guò)在最新的更新中,關(guān)于政治不正確的提示詞已被刪除。

Grok 引發(fā)爭(zhēng)議也不僅限于輿論上。由于其過(guò)于口無(wú)遮攔,因此招來(lái)了土耳其的封禁(因其侮辱總統(tǒng)埃爾多安),波蘭政府也向歐盟舉報(bào)了 xAI。

針對(duì) Grok 最近幾天的激進(jìn)言論,xAI 表示已采取行動(dòng),刪除不當(dāng)帖子并禁止仇恨言論。

圖 | xAI 回應(yīng),已采取措施防止仇恨言論(來(lái)源:xAI)

隨著 OpenAI 籌備 GPT-5、谷歌進(jìn)一步發(fā)展 Gemini、Meta 大手筆組建 AI 頂級(jí)人才實(shí)驗(yàn)室,Grok 4 只是下一波 AI 軍備競(jìng)賽的一員。

Grok 4 的亮相符合人們的普遍預(yù)期,它在推理性能上的提升創(chuàng)造了新的 SOTA,但另一方面,xAI 強(qiáng)調(diào)訓(xùn)練量提升 100 倍,卻避而不談的訓(xùn)練成本問(wèn)題,實(shí)實(shí)在在反應(yīng)到了定價(jià)上,說(shuō)明 AI 軍備競(jìng)賽的確過(guò)于燒錢。

但背靠財(cái)大氣粗的馬斯克,xAI 顯然很有底氣。

“創(chuàng)造一個(gè)既快又聰明的模型,是我們的當(dāng)務(wù)之急。”xAI 創(chuàng)始團(tuán)隊(duì)成員兼研究主管 Jimmy Ba 表示,“未來(lái)會(huì)很狂野。”

新車性能更多>>

紅旗天工05/06 800V超充破局補(bǔ)能焦慮,國(guó)風(fēng)美學(xué)+全場(chǎng)景智駕,15-20萬(wàn)級(jí)純電標(biāo)桿實(shí)至名歸 17.18萬(wàn)元起 紅旗天工05/06 800V超充版正式上市 新增云夢(mèng)銀車色 魏牌V9X正式開(kāi)啟預(yù)售 預(yù)售價(jià)區(qū)間37.18萬(wàn)-41.18萬(wàn)元 方程豹的 “多元宇宙”大概率會(huì)搭載 800V 高壓平臺(tái)與 4C 閃充技術(shù),成為方程豹高性能基因的新載體 大眾CEA量產(chǎn)實(shí)測(cè)車隊(duì)解析 消費(fèi)者視角評(píng)論 預(yù)售11.28-14.28萬(wàn)的銀河星耀7,一篇文章搞懂核心競(jìng)爭(zhēng)力 奧迪A6L e-tron與Q6L e-tron家族攜手亮相,豪華電動(dòng)時(shí)代正當(dāng)時(shí) 寶馬中國(guó)一季度再跌10%,從降價(jià)到換帥,新世代車型能否扭轉(zhuǎn)乾坤? 旗艦大滿配,不做選擇題!智己LS8上市,24.98萬(wàn)元起 埃安N60預(yù)售11.58萬(wàn)起,它如何重新定義家用好車? 金標(biāo)大眾與眾08導(dǎo)購(gòu):三款車型怎么選更合適 新款豐田Yaris Cross官圖,“八字胡”成為過(guò)去式 深藍(lán)汽車已經(jīng)通過(guò)用戶服務(wù)月的“五大主動(dòng)”,開(kāi)啟了從規(guī)模擴(kuò)張到價(jià)值經(jīng)營(yíng)的轉(zhuǎn)身 動(dòng)如疾“風(fēng)” 靜臥“云”端 風(fēng)云T9L九大越級(jí)僅12.99萬(wàn)元起 不做選擇題的年輕人,能讓15萬(wàn)級(jí)SUV市場(chǎng)卷出新高度嗎? 本田Prelude,矛盾重重但又棄之可惜的雙門小跑 售價(jià)區(qū)間12.99-18.69萬(wàn)元 搭載鯤鵬超能電混CDM6.0 奇瑞風(fēng)云T9L正式上市 廣汽以星源插混、星源超級(jí)雙擎(HEV+)為核心,疊加星源增程構(gòu)建全域動(dòng)力矩陣,重構(gòu)混動(dòng)行業(yè)新標(biāo)桿 13.38萬(wàn),歐拉5限定版憑什么讓99臺(tái)車1分28秒賣光? 30分鐘沒(méi)廢話 東風(fēng)日產(chǎn)這次把發(fā)布會(huì)開(kāi)成了“爽文” 馮長(zhǎng)軍:汽車設(shè)計(jì)是品牌靈魂的直觀體現(xiàn) 嵐圖汽車為上海交大和西安交大校慶提供出行保障 深度試駕沃爾沃XC90 T8:是不是新能源不重要,重要的是腔調(diào) 濟(jì)南展看麗馳:四大展區(qū)全系車型深度解析,三大核心技術(shù)引爆全場(chǎng) 3月份出口量“炸場(chǎng)”,中國(guó)汽車出海按下加速鍵 20萬(wàn)級(jí)家用MPV破局者:江淮瑞風(fēng)RF8悅享系列 重新定義全家舒適出行 尚界新車挑戰(zhàn)小米SU7, “全系滿配”能否后來(lái)居上? 比亞迪如何用12年啃下新加坡這塊“硬骨頭”? 純電SUV埃安N60即將迎來(lái)上市,新車定于4月16日開(kāi)啟預(yù)售 3月交付同比漲136%,是時(shí)候重估蔚來(lái)價(jià)值了
久久av综合,激情婷婷欧美,自拍自偷一区二区三区,久久精品免费一区二区三区
久久超级碰碰| 日韩超碰人人爽人人做人人添| 老司机免费视频一区二区| 日韩av二区在线播放| 日韩国产精品久久久| 日韩精品国产欧美| 欧美一级久久| 久久不卡日韩美女| 成人国产综合| 精品高清久久| 成人精品中文字幕| 亚洲一区二区免费看| 亚洲欧洲日韩| 国产精品亲子伦av一区二区三区 | 国产中文字幕一区二区三区| 麻豆精品视频在线观看免费| 福利视频一区| 亚洲天堂黄色| 亚洲综合激情在线| 久久爱www.| 韩国久久久久久| 中文久久精品| 日本午夜精品| а√在线中文在线新版| 欧美1区免费| 午夜天堂精品久久久久| 欧美国产三级| 欧美日韩精品免费观看视欧美高清免费大片 | 国产激情精品一区二区三区| 国产一区二区三区四区五区传媒| 久久久久蜜桃| 亚洲区国产区| 91一区二区三区四区| 91精品成人| 欧美一区成人| 日韩电影二区| 亚洲天堂免费| 国产91在线播放精品| 欧美在线资源| 国产精品一区二区av日韩在线| 日韩欧美中文| 亚洲一二av| 久久久精品国产**网站| 色一区二区三区| 日韩在线卡一卡二| 久久精品国产网站| 国产农村妇女精品一区二区| 国产精品久久久久久模特| 99久久夜色精品国产亚洲1000部| 日韩免费精品| 蜜臀久久精品| 婷婷综合电影| 亚洲天堂免费电影| 日本成人中文字幕| 日韩精品不卡一区二区| 亚洲日本在线观看视频| 日韩88av| 综合一区二区三区| а√天堂8资源中文在线| 欧美综合二区| 国产精品成人一区二区不卡| 石原莉奈在线亚洲三区| 国产va在线视频| 日本在线成人| 亚洲欧美日韩高清在线| 精品视频在线观看网站| 免费在线观看一区二区三区| 国产精品麻豆久久| 日韩精品一区二区三区免费视频| 欧美天堂视频| 国产精品一区高清| 亚洲激情av| 正在播放日韩精品| 日韩午夜视频在线| 国产韩日影视精品| 97精品国产一区二区三区| 日韩avvvv在线播放| 欧美在线资源| 91一区二区三区四区| 国产调教一区二区三区| 丝袜a∨在线一区二区三区不卡| 国产精品yjizz视频网| 97成人超碰| 免费看欧美美女黄的网站| 欧美日韩视频网站| 麻豆成人综合网| 国产香蕉精品| 蜜臀国产一区二区三区在线播放| 色爱综合av| 精品精品久久| 欧美色综合网| 日韩国产欧美在线播放| 亚洲一区二区三区四区五区午夜| 日韩在线综合| 国产精品99一区二区三区| 欧美亚洲三级| 免费一级欧美在线观看视频| 日本亚州欧洲精品不卡| 国产日韩欧美在线播放不卡| 亚洲一区网站| 激情六月综合| 蜜桃av.网站在线观看| 国产日韩高清一区二区三区在线| 国产免费成人| 亚洲国产一区二区在线观看| 成人日韩在线观看| 麻豆视频在线观看免费网站黄 | 美女视频一区在线观看| 欧美在线首页| 欧美日韩一视频区二区| 欧美一级全黄| 97精品资源在线观看| 97久久超碰| 亚洲区国产区| 日韩激情一区二区| 日韩av网站在线免费观看| 欧美自拍一区| 欧美国产日本| 久久精品国产999大香线蕉| 国产精品videosex极品| 国产精品1区| 免费在线成人| 成午夜精品一区二区三区软件| 精品国产精品国产偷麻豆| 国产在线视频欧美一区| 日韩av在线中文字幕| 蜜桃视频在线网站| 国产99精品一区| 在线国产一区| 日韩中文欧美在线| 五月激激激综合网色播| 国产欧美亚洲一区| 精品网站aaa| 日韩国产专区| 女同性一区二区三区人了人一| 99在线|亚洲一区二区| 久久亚洲视频| 日韩动漫一区| 精品中文在线| 日韩在线高清| 日韩午夜在线| 免费观看日韩电影| 91精品福利观看| 国产欧美在线| 国产激情综合| 丝袜诱惑一区二区| 日韩av一区二区三区四区| 国产精品久久久久av蜜臀| 成人精品国产亚洲| 国产精品av一区二区| 亚洲综合色婷婷在线观看| 欧美在线首页| 国产成人精品一区二区三区视频| 色爱av综合网| 免费看欧美美女黄的网站| 国产欧美自拍| 日韩精品不卡一区二区| 亚洲综合精品| 欧美午夜三级| 亚洲黄色中文字幕| 久久高清一区| 久久成人福利| 欧美+亚洲+精品+三区| 婷婷综合福利| 高清久久精品| 亚洲一区激情| 国产高清日韩| 伊人久久大香线蕉av不卡| 亚洲精品福利| 91亚洲国产| 伊人www22综合色| 久草精品视频| 夜久久久久久| 久久激情av| 99精品美女| 日本aⅴ亚洲精品中文乱码| 亚洲天堂av影院| 久久夜色精品| 福利一区和二区| 亚洲欧美网站| 精品少妇av| 久久大逼视频| 国产激情综合| 日韩网站在线| 久久99青青| 亚洲免费激情| 国产成人a视频高清在线观看| 亚洲免费在线| 久久尤物视频| 国产麻豆综合| 中文在线免费视频| 日韩精品视频网站| 久久亚洲专区| 精品国产一区二区三区噜噜噜| 国产精品普通话对白| 精品视频一区二区三区在线观看| 噜噜噜久久亚洲精品国产品小说| 麻豆国产精品视频| 亚洲精品大片| 亚洲国产成人精品女人|