7月23日消息,夸克健康大模型成功通過中國 12 門核心學(xué)科的主任醫(yī)師筆試評測,成為國內(nèi)首個完成這一挑戰(zhàn)的大模型。目前,“主任級 AI 醫(yī)生”能力已全面集成至夸克的AI搜索中,用戶在查詢健康問題時,選擇深度搜索即可調(diào)用。
這是繼5 月通過副主任醫(yī)師職稱考試后,夸克健康大模型能力的又一次躍升。在垂類模型與通用模型對比中,夸克健康大模型呈現(xiàn)出難度越高、領(lǐng)先優(yōu)勢越明顯的性能曲線,展現(xiàn)出在復(fù)雜醫(yī)學(xué)推理任務(wù)中的突破。
這揭示了在醫(yī)學(xué)領(lǐng)域研發(fā)垂類模型的巨大潛力。夸克健康大模型以通義千問為基礎(chǔ),走出了一條面向垂直場景的深度工程化路線!拔覀儾皇窃谟(xùn)練AI回答醫(yī)學(xué)問題,而是在訓(xùn)練它學(xué)會醫(yī)學(xué)思維”,夸克健康算法負責(zé)人徐健說。
夸克健康大模型的核心突破之一,是構(gòu)建出“慢思考能力”。該能力融合了鏈式推理與多階段臨床演繹路徑建模,驅(qū)動模型在面對復(fù)雜醫(yī)療問題時,能夠分階段、層層深入地推導(dǎo)出最終回答。
構(gòu)建慢思考能力的前提,是擁有高質(zhì)量推理訓(xùn)練數(shù)據(jù)。為此,夸克構(gòu)建了“雙數(shù)據(jù)產(chǎn)線 + 雙獎勵機制”的工程體系。一方面,將醫(yī)學(xué)數(shù)據(jù)劃分為“可驗證”和“不可驗證”兩類,分別對應(yīng)診斷類任務(wù)和健康建議類任務(wù);另一方面,在訓(xùn)練方法上引入“過程獎勵模型”和“結(jié)果獎勵模型”,分別評估模型推理鏈的合理性與最終結(jié)論的準確性,顯著提升模型的臨床可解釋性和推理一致性。
該體系還設(shè)計了多階段強化學(xué)習(xí)流程,包括冷啟動數(shù)據(jù)的嚴格人工校驗、多輪樣本篩選與難度遞進訓(xùn)練策略,以及用于防止“高分投機”的作弊識別機制。通過真實醫(yī)生標注、“問—思—答”整組數(shù)據(jù)驅(qū)動強化學(xué)習(xí),夸克健康大模型不僅學(xué)會了醫(yī)學(xué)知識,更掌握了醫(yī)學(xué)思維的路徑選擇、證據(jù)整合與多解平衡能力。底層的權(quán)威醫(yī)學(xué)知識庫確保了模型輸出內(nèi)容專業(yè)、及時。
安貞醫(yī)院心臟外科主任醫(yī)師謝進生認為,夸克在一些問題上回答專業(yè)度比專業(yè)醫(yī)生還要強。這一成果背后是專業(yè)醫(yī)師團隊的深度參與。目前,夸克健康大模型擁有千人規(guī)模的專業(yè)醫(yī)師標注團隊,其中超過400名均為副主任醫(yī)師及以上的高資歷醫(yī)療專家。
憑借在醫(yī)學(xué)領(lǐng)域的專業(yè)性,夸克AI搜索吸引了一大批醫(yī)學(xué)生和醫(yī)生群體?淇私】颠\營負責(zé)人趙存忠介紹,目前平臺在全國醫(yī)學(xué)生中月活用戶已突破 200 萬,覆蓋率過半,他們廣泛使用夸克用于基礎(chǔ)知識搜索、考試備考和臨床輔助診療。