這是鈦媒體專業(yè)用戶和付費(fèi)用戶專享的“鈦坦白”公開課第29期,我們請來了三位鈦客,給大家講講人工智能在醫(yī)療領(lǐng)域的應(yīng)用。本文根據(jù)本期鈦客之一、前麥肯錫資深咨詢師、DeepCare 羽醫(yī)甘藍(lán)科技創(chuàng)始人、CEO劉圣的分享整理。
如果您還不是鈦媒體Pro用戶,希望查看鈦坦白所有干貨,進(jìn)入鈦坦白九個專業(yè)群交流,并查看更豐富的專業(yè)數(shù)據(jù)和信息,可點(diǎn)擊:http://www.chcmb.cn/pro 注冊。
以下是劉圣在鈦坦白的分享:
我叫劉圣,我們公司叫DeepCare,就是deeplearnig和heachcare兩個單詞的組合,我們主要做的是把深度學(xué)習(xí)運(yùn)用在醫(yī)療影像的識別上。
市場的需求
病理被稱為是醫(yī)生的醫(yī)生,服務(wù)對象其實(shí)不是病人,而是臨床醫(yī)生。也就是說,病理醫(yī)生會診斷出病人罹患的是良性的腫瘤還是癌癥,如果是癌癥,會給癌癥分期分型,然后把這個診斷交給臨床醫(yī)生。臨床醫(yī)生會根據(jù)這個診斷來給病人制定治療和用藥的方案。
講到這里,我來問大家一個問題,大家都知道現(xiàn)在看病很難,不知道有哪位朋友花錢買過黃牛的票呢?我們買專家號看到的醫(yī)生和我們掛普通號看到的醫(yī)生,在診斷大病上的精確度到底有多大的差距呢?
兩個月前,我們做了一個實(shí)驗(yàn),請了北京的特級三甲、普通三甲和地方上的三甲醫(yī)院的一共四名醫(yī)生看70張乳腺癌轉(zhuǎn)移的片子。這四名醫(yī)生的年資分別是40年經(jīng)驗(yàn)、30年經(jīng)驗(yàn)、20年經(jīng)驗(yàn)和10年經(jīng)驗(yàn)。70張乳腺癌的片子有30張是陰性的,就是說沒有癌細(xì)胞的,有40張是陽性的就是有癌細(xì)胞的。
我們請這四位醫(yī)生看這70張片子,那位40年經(jīng)驗(yàn)的醫(yī)生的準(zhǔn)確率達(dá)到了98%以上,剩下的三位病理醫(yī)生,他們的平均準(zhǔn)確率在70%左右。
就這個實(shí)驗(yàn)來說,專家和普通醫(yī)生差距確實(shí)還是挺大的,怪不得黃牛號這么貴。我們做這個實(shí)驗(yàn),一方面是為了比較不同的醫(yī)生看病理切片的診斷會有多大的差異,另外一方面,我們用我們的算法也對同樣的70張片子進(jìn)行了診斷,當(dāng)時我們的準(zhǔn)確率是93%,那是在兩個月以前,現(xiàn)在我們準(zhǔn)確率已經(jīng)超過了95%。
從這個實(shí)驗(yàn)也可以看出,一方面,中國的醫(yī)療資源確實(shí)是非常不平均,專家和普通醫(yī)生之間的差距確實(shí)非常的大;另一方面,在一個定義非常明確的問題之上,算法其實(shí)可以做到比人或者是比一般人更好,可以無限接近最厲害的或者是最強(qiáng)的那個醫(yī)生的水平。
我們現(xiàn)在在做的事就是和北京的這些病理科,全國最強(qiáng)的科室的醫(yī)院合作,開發(fā)出智能算法,然后把這些算法運(yùn)用到基層醫(yī)院和三四縣城市當(dāng)中去。
下面這張圖片,左邊是屬于正常的細(xì)胞,右邊屬于癌變后的細(xì)胞。為什么一個病理醫(yī)生這么難培養(yǎng)?因?yàn)橛猩锨ХN疾病可能有上萬種不同的變化,這些變化讓任何一個人用人腦來記都是非常非常困難的。
一張病理切片里面包含的信息是非常大的,有十幾億個像素點(diǎn),一張壓縮過的圖片大概也有幾個G的大小,這么大量的信息讓人的眼睛來觀察,可以說非常辛苦,這種工作其實(shí)是非常適合計(jì)算機(jī)來做的。
在中國病理醫(yī)生非常的缺乏,大概平均七萬中國人一位病理醫(yī)生,而在美國是平均兩千人一位病理醫(yī)生。中國如果想達(dá)到美國的這個數(shù)字,按照中國現(xiàn)在培養(yǎng)病理醫(yī)生的速度大概要200年。我們在做的事情就是用人工智能的方式來彌補(bǔ)這個供需上的不平衡。
算法上的實(shí)現(xiàn)
下面這張圖片是我們診斷的流程。我們會把處理切片的算法分成三步:
- 第一步,預(yù)處理。就是把含有組織的這個部分從切片上面挑出來;
- 第二步,神經(jīng)網(wǎng)絡(luò)的處理分類。先把這些挑出來有組織的部分切成小塊,大家看這個圖的右上角,每一個小塊有一定大小,模擬醫(yī)生在顯微鏡下看到的大小,然后把每一個小塊放到顯微鏡神經(jīng)網(wǎng)絡(luò)里面,判斷這個小塊里邊是否含有癌細(xì)胞。大家可以看到,下面中間的這個藍(lán)色的圖就是最后結(jié)果的一個可視化的表達(dá),它其實(shí)是一個熱力圖;
- 第三步,后處理。就是從一個熱力圖得到最后的診斷報告。
我們的很多技術(shù)壁壘都是在第三步,這里有很多的醫(yī)生的先驗(yàn)知識,比如我們希望能把醫(yī)生腦袋里邊的算法變成電腦的算法,所以在這個里邊,我們一共從大概六十幾個不同的維度,有醫(yī)學(xué)方面的維度,也有非醫(yī)學(xué)方面的維度,共同來處理熱力圖,最后把它變成一句話的診斷,比如說這是什么癌,什么類型。
我們打算分成三步實(shí)現(xiàn):
- 第一步,勾畫病灶。我們會先在切片當(dāng)中勾畫病變的區(qū)域,像下面這張圖表現(xiàn)的一樣。
- 第二步,分型。我們會對勾畫的區(qū)域進(jìn)行判定,比如說肺癌分成五個比較大的亞型,它是哪一種亞型,乳腺癌分成四個亞型,它是哪種亞型。
- 第三步,分期。比如乳腺癌分成三期,國際上通用的標(biāo)準(zhǔn)叫做諾丁漢分期,病人屬于不同期,臨床大夫的治療方案是完全不一樣的,比如說級別高的就要進(jìn)行化療,級別低的可以保守治療或者用激素治療。
產(chǎn)品化的一些想法
很多朋友一定會問,算法要多準(zhǔn)才可以用?要怎么樣用?大家可以看看下面這張圖:
最左邊就是病理切片的圖片;
中間這張圖的縱軸叫敏感性,橫軸叫特異性。敏感性、特異性是兩個相對的指標(biāo),敏感性指的是查全率,特異性指的是準(zhǔn)確率。比如咱們一百個人里面有十個壞人,敏感性衡量的是我有沒有把這十個壞人都找到,特異性衡量的是這十個壞人有沒有抓對。比如說從敏感性來講,我如果只找到了九個壞人,我的敏感性就是90%,那從特異性來講,如果我抓了20個人才把這十個人都抓對,我的特異性就是50%。
這張圖就表現(xiàn)了一個比較可能的場景,就是說當(dāng)它的敏感度已經(jīng)達(dá)到99%以上的時候,它的特異性可能是在50%到60%,也就是說我確定每一個壞人我都會抓到,但是我大概只有60%的可能性抓到的是正確的壞人。其實(shí)在醫(yī)療行業(yè)里邊,敏感性是更重要的,特別是對于我們這樣的人工智能的算法來講,敏感性一定是要在99%以上,就是我不能夠錯放任何一個壞人,但是我可以抓錯,因?yàn)樽詈筮€是要醫(yī)生來看。
其實(shí)有很多的切片是陰性的切片,意思就是說它其實(shí)是沒有癌細(xì)胞的。比如卵巢癌的患者,因?yàn)槁殉灿幸粚?,所以可能會有很多取材的點(diǎn),有一些病人可能取得多會有三四十張切片,三四十張切片里面可能只有大概兩三張會有癌細(xì)胞,可是病理醫(yī)生他還是得看完所有的三四十張才可以最后得出個結(jié)論。我們想要使用這個產(chǎn)品的一種方式就是像下面這張圖表示的,我們先把陰性的片子(減號的片子)全部篩出來,這些片子醫(yī)生就不用再看了,醫(yī)生只要看陽性的片子就可以了。
我們剛才看到的其實(shí)都是H&E染色的切片,這種切片是最常見的切片,在這之后,近幾年像免疫組化、分子病理其實(shí)非常的流行,這些都和圖像相關(guān),就是說病理醫(yī)生會根據(jù)圖像來判斷病人的分子變異的靶點(diǎn),比如說蛋白子變異的靶點(diǎn)。
我們接下去會一步一步的往下延伸,就是除了我們從病理切片開始入手,接下去像免疫組化、分子病理,我們未來都可以涉足。
我們的第一個產(chǎn)品主要是針對乳腺癌的識別和分析、分期、分型。國家在推兩癌篩查,一個是乳腺癌,一個是宮頸癌,乳腺癌對于很多女性朋友來講其實(shí)是治愈率非常高的一個病種,在美國的五年存活率大概95%,可是在中國這個數(shù)字只有百分之七十幾。在全癌種來講,美國的五年存活率在60%多,中國這個數(shù)字才百分之三十幾。我們希望通過我們自己的一點(diǎn)點(diǎn)努力,可以讓中國的乳腺癌患者甚至是所有癌癥患者的存活率可以有一些提高。提高的方式就是及早發(fā)現(xiàn)癌變。
我們現(xiàn)在的這個產(chǎn)品已經(jīng)在二十多家醫(yī)院里進(jìn)行試用了,主要都是在三四線城市和縣城里邊,一些二甲及二甲以下的醫(yī)院。
國家衛(wèi)計(jì)委在去年年底和今年年初連發(fā)了兩道紅頭文件,大力推動了把四個科室獨(dú)立出來,包括影像科、檢驗(yàn)科、病理科和血液透析科,進(jìn)行集團(tuán)化或者是公司化運(yùn)營。這種獨(dú)立診斷中心在美國占市場的份額大概是40%,在日本占的是70%,在中國大概只占到4%左右。未來,獨(dú)立的病理中心、影像中心必然成為趨勢,我們這個算法以后一定會借著這股政策上的東風(fēng),很快地普及到基層醫(yī)院里面去。
鈦坦白群友Q&A:
1、請問劉大大,這套識別流程對其他疾病的識別是不是也能復(fù)用呢?
劉圣:每個疾病都要重新訓(xùn)練,所以只能一個疾病一個疾病來。主要是數(shù)據(jù)的標(biāo)注,技術(shù)路線是一樣的。
2、請問劉總,目前你的商業(yè)模式是和醫(yī)院的病理科合作,通過承接他們的圖像分析,獲得收益?
劉圣:其實(shí)我們急著產(chǎn)品化,但是不急著商業(yè)化。所以目前醫(yī)院都是免費(fèi)試用,未來我相信只要創(chuàng)造出價值,一定可以找到商業(yè)模式。醫(yī)療是個慢生意,人工智能也是個慢生意,兩個加一起就更慢了。
3、劉總你好,卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建后通用性較為強(qiáng),現(xiàn)在,在CT、MRI影像領(lǐng)域比較多。不知道,在心電圖輔助診斷、內(nèi)窺鏡這些小眾領(lǐng)域,是否有價值?
劉圣:內(nèi)窺鏡一定可以,我們之前有做過。心電圖也有可能,但是一般的心電圖其實(shí)不需要CNN來做,冠狀造影可能更可以發(fā)揮CNN的優(yōu)勢。
(本文獨(dú)家首發(fā)鈦媒體,根據(jù)DeepCare 羽醫(yī)甘藍(lán)科技創(chuàng)始人、CEO劉圣在鈦坦白微信交流課上的分享整理)
………………………………………………
鈦坦白第29期,人工智能在醫(yī)療健康領(lǐng)域的應(yīng)用,三晚上的分享已經(jīng)結(jié)束。
干貨會陸續(xù)發(fā)布:http://www.chcmb.cn/tag/1508094
鈦坦白第30期預(yù)告:跑步和相關(guān)賽事運(yùn)營
時間:2月20日、21日、22日,每晚7點(diǎn)開始
地點(diǎn):鈦坦白|體育(微信群)
報名聽課、參與垂直人群互動:
鈦坦白目前有醫(yī)療健康、人工智能、文娛社交、VR/AR、區(qū)塊鏈、支付創(chuàng)新、體育、云計(jì)算、SaaS等九個專業(yè)交流群。
1、鈦媒體Pro專業(yè)版用戶,可以點(diǎn)擊鏈接http://www.chcmb.cn/pro,登錄賬號,點(diǎn)擊進(jìn)入“在線課堂”,在線免費(fèi)、任意選擇自己要進(jìn)入的群,按提示操作;
2、非鈦媒體Pro專業(yè)版用戶,可以添加微信號taitanbai0,在通過好友后,發(fā)99元紅包給小鈦,你將有權(quán)利從九個群中任選一個群進(jìn)入,長期聽課、交流。請告訴小鈦你要進(jìn)入哪一個群,然后等待小鈦拉你入群~
推薦鈦客、贊助、合作:
請與鈦坦白負(fù)責(zé)人佳音聯(lián)系,郵箱jiayinge@tmtpost.com






快報
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論
不急著商業(yè)化,如何支撐???人工智能現(xiàn)在算是在一個資本市場的風(fēng)口上,但是不能盡快得到商業(yè)模式的實(shí)踐,還是比較難長期的運(yùn)作!
我覺得跟醫(yī)療相關(guān)的話,還是更加謹(jǐn)慎點(diǎn)比較好,如果出事情了,誰也擔(dān)不起,像siri,靈犀語音助手這樣可以娛樂和服務(wù)性質(zhì)為主的人工智能玩玩還不錯,其他的還是等更成熟點(diǎn)吧。