高通:OpenAI 最小開源模型 gpt-oss-20b 可在驍龍終端運行
8 月 11 日消息,OpenAI 于 8 月 6 日推出了其最小開源模型 gpt-oss-20b,在常見基準測試中與 OpenAI o3‑mini 模型取得類似結果。高通今日宣布,這是 OpenAI 首個可在搭載驍龍平臺的終端側運行的開源推理模型。

IT之家從官方新聞稿獲悉,高通稱 gpt-oss-20b 思維鏈推理模型可直接在搭載驍龍旗艦處理器的終端上運行。此前 OpenAI 的復雜模型僅限云端部署,這是 OpenAI 首次實現(xiàn)模型支持終端側推理。通過提前獲取模型,并結合高通 ® AI 引擎和 Qualcomm® AI Stack 進行集成測試,我們發(fā)現(xiàn)這款 200 億參數(shù)的模型表現(xiàn)極為出色,能夠完全在終端側進行思維鏈推理。
高通認為這是一個關鍵轉折點:預示著 AI 的未來方向,即豐富復雜的助手式推理也將在本地實現(xiàn)。這也展現(xiàn)了 AI 生態(tài)系統(tǒng)的成熟性,合作伙伴和開發(fā)者可以利用驍龍?zhí)幚砥,實時采用 OpenAI 等領軍企業(yè)的開源創(chuàng)新成果。OpenAI 的 gpt-oss-20b 將助力終端設備利用終端側推理,帶來隱私保護和時延方面的優(yōu)勢,同時通過 AI 智能體為云端解決方案提供支持。
高通稱,通過提前獲取 gpt-oss-20b 模型,并結合 Qualcomm AI Stack 進行集成測試,見證了該模型的卓越能力,它能完全在終端側進行復雜推理。開發(fā)者將可通過 Hugging Face 和 Ollama 等主流平臺獲取該模型,并在搭載驍龍平臺的終端上發(fā)揮其性能。更多部署詳情即將在 Qualcomm AI Hub 上公布。
將 Ollama 的輕量級的開源 LLM 服務框架和強大的驍龍平臺集成,開發(fā)者和企業(yè)不僅可以直接在搭載驍龍計算平臺的終端上運行 gpt-oss-20b 模型,還能夠進行網頁搜索等多個默認特性,無需額外配置。用戶也可以在 Ollama 上嘗試 Turbo 模式,以探索該模型的更多功能。
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創(chuàng)”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發(fā)之日起30日內與本網聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
5G-A賦能機器人火炬接力:中國移動以技術革新點亮全運科技盛宴
2025年11月,第十五屆全國運動會將在粵港澳三地盛大啟幕。這場賽事不僅是體育健兒的競技場,更是前沿科技落地應用的“試驗田”。其中,11月2日的機器人火炬接力作為本次全運會的核心創(chuàng)新亮點..[詳細]
輕薄機型出師未捷身先死,長使業(yè)績淚滿襟
當iPhone Air宣布上市當天,隨著各路評測內容解禁,一個顯眼的標題也隨之出現(xiàn),那就是“注定停產”。輕薄機型的出現(xiàn)一方面讓人們看到廠商正在挖掘全新市場空間,另一方面也勾起了小尺寸機型..[詳細]
智能未來:宇宙為你閃爍
未來十年,你家的電表可能再也不用換電池,自動駕駛汽車能"看到"幾公里外的路況,甚至海洋深處的傳感器都能實時傳回數(shù)據(jù)。這些不是科幻,而是剛剛在無錫物博會上發(fā)布的《2025全球..[詳細]
智能IP廣域網成為筑牢智算產業(yè)發(fā)展根基的關鍵一環(huán)
隨著國家加速推動智算產業(yè)高質量發(fā)展,網絡支撐能力已成為產業(yè)進階的核心抓手,而作為關鍵基礎設施的智能IP廣域網,正憑借其在算力調度、數(shù)據(jù)傳輸中的核心作用,成為筑牢智算產業(yè)發(fā)展根基的..[詳細]
大中華區(qū)市場失守 蘋果寄望AI驅動未來增長
蘋果公司公布的2025 財年第四季度財報呈現(xiàn)“冰火兩重天”態(tài)勢:全球營收1024.66億美元同比增長 8%,凈利潤274.66億美元同比激增86.4%,毛利率攀升至 47.18%。但作為第三大市場的大中華區(qū)卻成..[詳細]













