圖片由AI生成
AI正在與醫(yī)生正面交鋒,讓醫(yī)生是絕對(duì)權(quán)威的時(shí)代成為過(guò)去式?,F(xiàn)在,患者在看病之前,會(huì)先用AI大模型問(wèn)一遍,再到醫(yī)院與醫(yī)生討論病情。
“不管醫(yī)生喜歡不喜歡,我們都要面臨這樣的問(wèn)題,很多病人是問(wèn)了DeepSeek或者ChatGPT之后,再來(lái)醫(yī)院看病。”北京大學(xué)醫(yī)學(xué)部皮膚與性病學(xué)系主任,北京大學(xué)人民醫(yī)院皮膚科副主任、主任醫(yī)師、博士生導(dǎo)師李厚敏對(duì)作者表示。
尤其是她發(fā)現(xiàn),在一線城市,甚至有生活在國(guó)外而回國(guó)看病的患者,他們還了解各國(guó)的診療指南,并以此與醫(yī)生探討問(wèn)題。
而隨著垂類大模型正在醫(yī)學(xué)領(lǐng)域展現(xiàn)巨大潛力,醫(yī)療大模型臨床輔助實(shí)用性得到進(jìn)一步的提高。
今年5月,OpenAI發(fā)布了全新的開源模型HealthBench。這是一項(xiàng)衡量AI模型在醫(yī)療領(lǐng)域新的基準(zhǔn)測(cè)試,由來(lái)自60個(gè)國(guó)家的262位醫(yī)生合作打造。HealthBench內(nèi)置了5000段真實(shí)的健康對(duì)話,每段對(duì)話都配有醫(yī)生創(chuàng)建的自定義評(píng)分標(biāo)準(zhǔn)。而GPT-4.1在評(píng)分模型的7個(gè)主題中,有5個(gè)主題的表現(xiàn)超過(guò)了醫(yī)生平均水平。
7月,微軟最新發(fā)布的突破性醫(yī)療AI系統(tǒng)MAI-DxO。研究人員收集了《新英格蘭醫(yī)學(xué)雜志》發(fā)布的真實(shí)疑難病例,在304例病例測(cè)試中,MAI-DxO診斷系統(tǒng)的AI診斷準(zhǔn)確率達(dá)85.5%,遠(yuǎn)超人類醫(yī)生20%左右的準(zhǔn)確率,而MAI-DxO成本更低、效率更高。
國(guó)產(chǎn)大模型在這一領(lǐng)域也有相關(guān)進(jìn)展披露。7月23日,夸克方面宣布,夸克健康大模型成功通過(guò)中國(guó)12門核心學(xué)科的主任醫(yī)師筆試評(píng)測(cè)。目前,“主任級(jí)AI醫(yī)生”能力已全面集成至夸克的AI搜索中,用戶在查詢健康問(wèn)題時(shí),選擇深度搜索即可調(diào)用。
夸克健康大模型以通義千問(wèn)為基礎(chǔ),面向垂直場(chǎng)景的做了深度工程化的工作??淇私】邓惴ㄘ?fù)責(zé)人徐健向作者介紹,夸克健康大模型的核心突破之一,是構(gòu)建出“慢思考”能力。
該能力融合了鏈?zhǔn)酵评砼c多階段臨床演繹路徑建模,驅(qū)動(dòng)模型在面對(duì)復(fù)雜醫(yī)療問(wèn)題時(shí),能夠分階段、層層深入地推導(dǎo)出最終回答。
這背后是基于夸克構(gòu)建的“雙數(shù)據(jù)產(chǎn)線+雙獎(jiǎng)勵(lì)機(jī)制”的工程體系。一方面,模型將醫(yī)學(xué)數(shù)據(jù)劃分為“可驗(yàn)證”和“不可驗(yàn)證”兩類,分別對(duì)應(yīng)診斷類任務(wù)和健康建議類任務(wù);另一方面,在訓(xùn)練方法上引入“過(guò)程獎(jiǎng)勵(lì)模型”和“結(jié)果獎(jiǎng)勵(lì)模型”,分別評(píng)估模型推理鏈的合理性與最終結(jié)論的準(zhǔn)確性,提升模型的臨床可解釋性和推理一致性。
據(jù)徐健介紹,健康大模型在診療上的效果,門診常見病場(chǎng)景下,模型診斷準(zhǔn)確率達(dá)90.78%,與人類醫(yī)生書寫的病歷準(zhǔn)確率水平相當(dāng)。
事實(shí)上,在健康領(lǐng)域,模型可靠性至關(guān)重要,一個(gè)錯(cuò)誤的答案的破壞性,可以抵消掉數(shù)個(gè)正確答案為AI帶來(lái)的優(yōu)勢(shì)。
醫(yī)療垂直模型需要專業(yè)醫(yī)師團(tuán)隊(duì)的深度參與。OpenAI聯(lián)動(dòng)了多國(guó)醫(yī)生聯(lián)合打造醫(yī)療模型,而夸克健康大模型背后也有千人規(guī)模的專業(yè)醫(yī)師標(biāo)注團(tuán)隊(duì),其中,超過(guò)400名為副主任醫(yī)師及以上的高資歷醫(yī)療專家。
不過(guò),很多醫(yī)生對(duì)于醫(yī)療大模型秉持的是審慎接受的態(tài)度。
李厚敏認(rèn)為,診療指南或者AI給出的答案通常都很泛,針對(duì)個(gè)體具體的病癥的診療,還是需要專業(yè)人士給出建議。而且,面對(duì)同一個(gè)AI解答,學(xué)醫(yī)與沒有學(xué)醫(yī)的人,是無(wú)法達(dá)到同等級(jí)水平來(lái)理解具體的病癥,這是為什么當(dāng)前AI還不能替代醫(yī)生底層邏輯之一。
“患者可以通過(guò)AI收獲對(duì)疾病基礎(chǔ)知識(shí)的認(rèn)知,比如說(shuō),皮膚的問(wèn)題可能與作息、睡眠有關(guān),也可能是壓力與焦慮導(dǎo)致。AI可以讓他們更好地理解病情,這二者之間不矛盾。”李厚敏說(shuō)。
事實(shí)上,不只是患者使用AI問(wèn)診,醫(yī)生群體的成長(zhǎng)路徑,正或多或少由AI來(lái)輔助塑造。
據(jù)夸克健康運(yùn)營(yíng)負(fù)責(zé)人趙存忠透露,當(dāng)前使用夸克健康的醫(yī)學(xué)生群體月活躍用戶已經(jīng)超過(guò)了200萬(wàn),占總體醫(yī)學(xué)生50%以上。他們分析后發(fā)現(xiàn),周內(nèi)學(xué)習(xí)、期末考試時(shí)間的上半周,醫(yī)學(xué)生使用AI的頻率最高。醫(yī)學(xué)生的三大核心訴求是解題、查解析、術(shù)語(yǔ)解釋和教材知識(shí)點(diǎn)。
后續(xù),專業(yè)搜索也將逐步延伸到低年資醫(yī)生等垂直人群,AI可以滿足臨床的知識(shí)查詢和處理決策、用藥需求,也包括高年資醫(yī)生的科研、學(xué)術(shù)搜索的工作。
AI的另一個(gè)重要作用體現(xiàn)在輔助精神疾病的治療上,因?yàn)檫@類疾病具有一定的隱蔽性。
武漢大學(xué)精神衛(wèi)生中心主任、教授、主任醫(yī)師、博士生導(dǎo)師王惠玲認(rèn)為,抑郁癥看不見、摸不著,但確實(shí)會(huì)影響人們的生活。現(xiàn)在大家對(duì)精神疾病和心理問(wèn)題,往往有一種“病恥感”。
王惠玲分享了一個(gè)病例。她有一位嚴(yán)重抑郁癥患者,該患者為了迎合外界期望(其老師曾建議他不要一臉“苦相”),通過(guò)刻意練習(xí)展現(xiàn)出標(biāo)準(zhǔn)化、極具迷惑性的“陽(yáng)光笑容”,甚至騙過(guò)了專業(yè)醫(yī)生。但他內(nèi)心痛苦始終真實(shí)存在,伴隨失眠等癥狀,影響日常生活。
在這個(gè)病例中,AI則可以通過(guò)分析面部表情(如瞳孔變化)、語(yǔ)音語(yǔ)調(diào)和動(dòng)作姿態(tài)等細(xì)微生物標(biāo)記,客觀識(shí)別“假笑”,輔助診斷抑郁癥,避免被表象誤導(dǎo)。
實(shí)際上,當(dāng)AI朝著“高情商”進(jìn)化的時(shí)候,它能解決的不僅是專業(yè)知識(shí)的問(wèn)題,還能在日常生活中,給予人類情感支持。
萬(wàn)事不決問(wèn)AI,生活中的煩惱事,AI也會(huì)提供解決方案。而當(dāng)AI產(chǎn)品越來(lái)越模糊年齡邊界,借助AI玩具拓展至幼兒等更低齡階段的時(shí)候,這又會(huì)對(duì)人類的認(rèn)知和行為模式產(chǎn)生什么影響?
王惠玲對(duì)作者表示,這正是目前國(guó)內(nèi)專家正在思考和研究的問(wèn)題?,F(xiàn)在的確有很多年輕人通過(guò)與AI溝通的方式傾訴煩惱。至于到底會(huì)產(chǎn)生什么影響,還有待足夠的樣本數(shù)據(jù)觀察。
她認(rèn)為,有渠道總比沒有渠道要好。這類陪伴式AI,解決當(dāng)前一個(gè)現(xiàn)實(shí)問(wèn)題是,在心理臨床診療中,人力資源不足的問(wèn)題?,F(xiàn)在的醫(yī)療機(jī)構(gòu)會(huì)采用輔助心理治療的機(jī)器人,雖然這類工具還不太完善,但至少可以減少專業(yè)醫(yī)生的部分工作量,以節(jié)省醫(yī)療資源。
現(xiàn)階段,一個(gè)較好的場(chǎng)景是學(xué)生群體心理問(wèn)題治療。她的同事正在做的事情是,在學(xué)生喜歡的“AI樹洞”里發(fā)現(xiàn)那些有潛在自殺傾向的高危人群,提前做好相關(guān)干預(yù)工作,減少不良事件的發(fā)生。
不過(guò),她也提醒,與AI溝通的前提是,要關(guān)注AI的質(zhì)量,以及,構(gòu)建它背后的數(shù)據(jù)庫(kù),因?yàn)椴慌懦械纳鐓^(qū)本身是充滿負(fù)能量的,則會(huì)造成更壞的影響。AI心理治療效果,取決于用戶選擇用什么AI。
心智成熟的人可以選擇自認(rèn)為合適的方式緩解壓力。而對(duì)更低齡的兒童來(lái)說(shuō),依賴電子產(chǎn)品已經(jīng)是一種趨勢(shì)。而這種情況究竟會(huì)對(duì)人類產(chǎn)生什么影響,還需要更系統(tǒng)的觀察。
王惠玲舉例說(shuō),這類問(wèn)題有點(diǎn)像是早教,家長(zhǎng)們往往傾向于讓小朋友更早的識(shí)字、寫字,但最近有學(xué)者研究后發(fā)現(xiàn),過(guò)早學(xué)習(xí)寫字并不利于左右腦的發(fā)育,早教可以讓小朋友聽、學(xué)語(yǔ)言,唱歌,但學(xué)習(xí)寫字可能會(huì)對(duì)大腦發(fā)育產(chǎn)生一定的負(fù)面影響。
“過(guò)早地使用電子產(chǎn)品,或者使用AI治療工具,是研究過(guò)程中一個(gè)有關(guān)倫理方面的考量,專業(yè)醫(yī)學(xué)上需要更多的數(shù)據(jù)和資料才能有答案。”王惠玲說(shuō)。(本文首發(fā)于鈦媒體APP,作者|李程程,編輯|李玉鵬)
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論
夸克 AI 集成到搜索里,查健康問(wèn)題更方便了。
AI 能識(shí)別抑郁癥患者的 “假笑”,這功能挺實(shí)用。
200 多萬(wàn)醫(yī)學(xué)生用夸克健康,這普及率可以。
AI 再厲害,也替代不了醫(yī)生的臨床經(jīng)驗(yàn)吧
過(guò)早用電子產(chǎn)品對(duì)孩子不好,AI 也一樣?
“AI 樹洞” 能發(fā)現(xiàn)高危人群,預(yù)防悲劇發(fā)生。
醫(yī)療 AI 數(shù)據(jù)庫(kù)很重要,別帶偏了用戶。
醫(yī)學(xué)生用 AI 學(xué)習(xí)的不少,能幫著復(fù)習(xí)考試吧。
醫(yī)生不排斥 AI,但覺得不能替代自己。
AI 當(dāng)醫(yī)療輔助還行,真想替代醫(yī)生還早。