馬斯克發表「Grok 3」 xAI:效能擊敗GPT-4o
回上一頁
(2025/02/18 14:33:10)

MoneyDJ新聞 2025-02-18 14:33:10 記者 郭妍希 報導

馬斯克(Elon Musk、見圖右)旗下新創商xAI在週一(17日)晚間釋出最新旗艦AI模型「Grok 3」,號稱效能擊敗OpenAI的先進模型「GPT-4o」。

TechCrunch、Axios等外電報導,馬斯克17日在社交平台X的直播中指出,「Grok 3的運算能力比Grok 2高出一個數量級」,這是一個「極度追求真相的AI,即便這個真相有時並不政治正確。」

精確來說,Grok 3指的是一系列AI模型。小型版「Grok 3 mini」回答問題的速度較快,但會犧牲些許正確性。不是所有模型都立即可用,但會從週一開始陸續發布。

xAI聲稱,Grok 3在多項基準測試中擊敗Google的Gemini、DeepSeek的V3、Anthropic的Claude以及OpenAI的GPT-4o,當中包括評估模型運算數學題樣本能力的「AIME」測試,以及衡量模型解答博士級物理學、生物學和化學問題能力的「GPQA」測驗。

在眾籌的「Chatbot Arena」測驗中,Grok 3初期版本對問題的回應,相對於其他聊天機器人也更具競爭力。Chatbot Arena會讓不同AI模型打擂台,讓用戶票選出自己偏好的模型。

Grok 3還包括兩種版本「Grok 3 Reasoning」及「Grok 3 mini Reasoning」,能「徹底思考」(think through)問題,類似OpenAI「o3-mini」及DeepSeek「R1」模型的「推理」(reasoning)過程。推理模型在給出答案前會自行查驗事實,有助於避開一些常見陷阱。

xAI聲稱,Grok 3 Reasoning在數個熱門的能力測驗中,效能超越OpenAI「o3-mini」的最佳版本「o3-mini-high」,當中包括一款較新的數學能力檢驗模型「AIME 2025」。

上述推理模型可透過Grok應用程式(app)取得。使用者可要求Grok 3對較困難的問題進行「思索」(think),以「大腦」(Big Brain)模式運用更多算力進行推理。馬斯克表示,部分推理過程會被刻意隱藏,以免其他AI模型開發商透過「蒸餾法」(distillation)從中提取知識。

Grok的推理模式還會加入新功能「DeepSearch」,能搜尋網路及社交平台X的資訊來進行分析,對用戶的詢問提供摘要回答。DeepSearch主要是回應像是OpenAI「Deep Research」的深度檢索工具。

X的Premium+訂閱戶可率先使用Grok 3,其他功能則須訂閱xAI的「SuperGrok」才能解鎖。SuperGrok月費30美元、年費300美元,能解鎖額外的推理及DeepSearch查詢次數,並包含無限次的圖像生成功能。

馬斯克還指出,xAI將在幾個月後讓Grok 2轉為開源模型。他說,「我們的做法是,在最新版本完全推出後,會將上一版本開源。」

(圖片來源:xAI)

*編者按 :本文僅供參考之用,並不構成要約、招攬或邀請 、誘使、任何不論種類或形式之 申述或訂立任何建議及推薦,讀者務請運用個人獨立思考 能力,自行作出投資決定,如因相關建議招致損失,概與《精實財經媒體》、編者及作者無涉。

註1: 基金績效計算皆有考慮配息,基金配息率不代表基金報酬率,且過去配息率不代表未來配息率。所有基金績效,均為過去績效,不代表未來之績效表現,亦不保證基金之最低投資收益。
註2: 基金淨值可能因市場因素而上下波動,基金淨值僅供參考,實際以基金公司公告之淨值為準;部份基金採雙軌報價,實際交易以基金公司所公告的買回價/賣出價為計算基礎。
註3: 上述銷售費用僅供參考,實際費率以各銷售機構為主。
註4: 上述短線交易規定資料僅供參考,實際規定應以基金公開說明書為主。
註5: 境內基金經行政院金融監督管理委員會核准在國內募集及銷售,惟不表示絕無風險。基金經理公司以往之經理績效不保證基金之最低投資收益;基金經理公司除盡善良管理人之注意義務外,不負責本基金之盈虧,亦不保證最低之收益,投資人申購前應詳閱基金公開說明書。
註6: 依金管會規定基金投資大陸證券市場之有價證券不得超過本基金資產淨值之10%,當該基金投資地區包含中國大陸及香港,基金淨值可能因為大陸地區之法令、政治或經濟環境改變而受不同程度之影響。
註7: 上述資料只供參考用途,嘉實資訊自當盡力提供正確訊息,但如有錯漏或疏忽,本公司或關係企業與其任何董事或任何受僱人,恕不負任何法律責任。