LUNA再次夺冠,科大讯飞向世界宣告自己的实力不止于语音
近日,科大訊飛可謂喜報連連,除了日益躥升的股價,技術方面的好消息也不絕于耳。8月7日,科大訊飛在其官方微信公眾號上給外界傳遞了一封喜報,并附以“科大訊飛刷新LUNA醫學影像國際權威評測世界記錄!”這樣振奮人心的標題。
提到科大訊飛,相信很多熟悉這家公司的朋友們會聯想到它在語音識別、語義理解、機器翻譯等領域的耕耘,但它究竟是什么時候涉足到計算機視覺和智慧醫療領域的呢?
據AI科技大本營了解,訊飛早在2010年開始在視覺領域持續投入,2015年涉足智慧醫療領域,不僅將智能語音技術應用到了醫療,業務還涉及了醫療影像,以及類似于IBM?Watson的基于認知計算的輔助診療系統。
時隔幾年,訊飛通過成績證明了自己在視覺方面的實力,用訊飛人自己的話說就是:“訊飛在計算機視覺與醫學影像相結合的重要領域亦走到了世界前列”。
關于LUNA
據AI科技大本營了解,LUNA (LUng Nodule Analysis) 評測是肺結節檢測領域權威的國際評測,也是醫學影像領域最具代表性、最受關注的評測任務之一。其采用的數據來自美國多家醫療機構,并且由多名專家醫生共同標注完成。該評測從2016年開始,吸引了大批國內外學術界和產業界團隊的參與,包括香港中文大學、北京大學、浙江大學、奈梅亨大學、阿里巴巴、Mevis以及諸多新興創業公司。
在全球范圍內,肺癌是癌癥中死亡率最高的疾病之一。目前,美國正在推進用低劑量CT來掃描篩查高風險個體肺癌的方法,其他國家也有望近期跟進。
在對肺癌的CT篩查過程中,放射科的醫生必須要分析數百萬的CT影像,這對他們來說是個巨大的負擔。因此,開發一款智能算法來優化這些篩選過程就顯得很有必要了。
肺癌篩查的關鍵性第一步是對肺結節的檢測,它可以表征出受檢者到底有沒有患有早期肺癌。很多計算機輔助檢測系統(CAD)正致力于解決這個問題。LUNA16挑戰賽聚焦在基于?LIDC/IDRI?數據庫的結節大規模自動檢測與評估。
LIDC / IDRI數據集是公開的,上面包含四個放射科醫生的結節標注信息,它被等分成 10 個子集,參賽者要利用這 10 個子集進行交叉驗證,最后的測試結果合并作為最終的結果提交系統。評價程序將 FROC 曲線(free receiver operating characteristic)在 7 個不同誤報率(1/8, 1/4, 1/2, 1, 2, 4, and 8 FPs)下對應的召回率平均值作為算法性能的評價結果。
所謂的召回率,是醫學影像輔助診斷系統中最主要的指標,召回率低意味著系統會漏掉患者的關鍵病灶信息,對患者的健康造成很大隱患。本次訊飛最新提交的召回率成績為94.1%.
冠軍幾經易主
其實,LUNA16的冠軍爭奪異常激烈,成績不斷地被刷新。今年年初,來自中國的杭州健培科技榮登榜首,并將此記錄保持了6個月,7月13日該記錄被阿里iDST打破,但6天后健培科技重新奪回冠軍。8月3日,該成績又被科大訊飛團隊刷新,11天后,健培科技再次奪回第一,8月17日,訊飛以0.941的召回率再次刷新紀錄。目前的排名情況如下圖所示。可以看出,前三名全部由中國團隊包攬。
那么參加LUNA比賽的團隊具體情況如何?訊飛的算法有哪些獨特之處?目前在和哪些醫院進行合作?AI科技大本營采訪到了科大訊飛研究院劉聰副院長,以及智慧醫療常務副總經理鹿曉亮,為大家解答這些疑惑。
以下為AI科技大本營對訊飛相關負責人的采訪實錄:
關于團隊及公司戰略
AI科技大本營:請簡單介紹一下參與這次比賽的團隊,與訊飛其他部門的架構關系,聚焦領域。公司有無參加剔除假陽性的比賽?
劉聰:參賽團隊是研究院醫學影像方向和智慧醫療事業部聯合團隊,主要負責醫學影像算法的研發和系統在醫院的落地。公司沒有參加剔除假陽性的比賽。?
AI科技大本營:訊飛是什么時候開始切入視覺領域的研發的?提到訊飛,大家都會想到你們在語音方面的業務,為什么要選擇切入視覺領域,是公司戰略方面有什么改變或補充嗎?
劉聰:訊飛從2010年左右開始即在視覺領域開始持續投入。作為中國人工智能領域的佼佼者,科大訊飛除了深耕智能語音領域以外,也在視覺和自然語言理解等人工智能相關領域持續布局,以期更好的發揮人工智能技術的價值、提供更好的產品體驗。訊飛在計算機視覺領域主要選擇和業務需求結合緊密的方向投入,具體包括手寫圖文、醫學影像、視頻分析等方向。
關于技術
AI科技大本營:檢測肺結節的過程分為幾步?是否是端到端的?
劉聰:在通用物體檢測中,one-stage(SSD,YOLO,Focal-Loss等方法)與two-stage(Faster-RCNN等方法)也一直是討論的熱點,大家一般針對具體任務進行合適的選擇。
對于肺結節檢測任務,我們分析并通過實驗驗證two-stage有著比較明顯的優勢,第一步驟先給出更多的結節候選以保證召回率,第二步驟在上述結節候選中進一步去除非結節區域以改善對應的虛警率。
?
AI科技大本營:和其他參賽隊伍相比,算法方面有哪些獨特之處嗎?
?
劉聰:3D CNN模型是訊飛此次參加LUNA評測的獨特之處之一。訊飛應該是最早將3D CNN方案應用于肺結節檢測的機構之一,相對于此前主流的2D或者2.5D方案,3D模型更加適合于基于CT影像的肺結節檢測任務。
然而,僅僅套用3D CNN模型并不夠,還需要使用合適的3D CNN模型配置并解決3D CNN的訓練效率問題。
?
AI科技大本營:在訊飛的對外新聞稿中,有這樣的描述:“訊飛采用了多尺度、多模型集成學習的方法來顯著提升召回率,同時針對該方案引起的負面影響——虛警的增多和重復檢測問題,我們還創新性的使用結節分割和特征圖融合的策略來進行改善”,可否簡述一下其中“多尺度、多模型集成學習方法”以及“結節分割和特征圖融合策略”?
?
劉聰:這些方法主要都是借鑒傳統圖像識別和檢測中常用的模型改進方案,當然要針對醫學影像任務進行適配性改進。例如多尺度方案主要這對各種大小的結節能獲得比較穩定的檢測效果,而多模型集成學習則利用多個不同配置的神經網絡模型進行融合決策獲得效果互補的作用。
當然,如何將這些主流的技術方法針對特定任務進行合適的搭配和局部優化,則是難度更高的任務,該部分屬于訊飛的核心機密,不便展開。
?
AI科技大本營:如果要進一步提升召回率的話還需要做哪些提升?提升空間還大不大?
?
劉聰:在算法方面,模型結構、訓練策略等還可進行優化,但在該評測任務上的提升空間不大。
另一方面在數據方面,即使在LUNA這樣高質量的評測任務上,數據標注準確性仍然有進一步的提升空間,提升標注準確性能帶來召回率進一步的提升。
此外,在基于深度學習的醫學影像識別框架下,持續增加訓練數據的數量也會進一步帶來性能的提升(只是LUNA評測目前并沒有進一步擴大數據規模的計劃)。我們更加關注的是在實際任務上獲得更多的真實數據,來持續提升效果,我們認為在實際系統中核心效果的提升空間更大。
關于落地應用
AI科技大本營:這個模型(醫學影像輔助診斷系統)能直接應用到醫院了嗎?效果如何?目前和哪家醫院合作?
?
鹿曉亮:目前科大訊飛醫學影像智能輔助診斷系統基于圖像識別和深度學習技術,結合醫學專家診斷經驗和大量樣本數據,能自動從醫學影像中檢出病灶并對良惡性作出判斷,輔助醫生快速、準確地完成影像診斷。
當前系統從發病率最高的肺癌入手,從胸部CT圖像中自動檢測肺結節并判斷其良惡性,對肺癌的早期診斷和篩查有重要意義。未來還將擴展到乳腺鉬靶、X光胸片、磁共振等檢查方式上,讓人工智能技術成為醫生的第二雙眼睛和第二個大腦,減少因為疏忽、疲勞等造成的誤診、漏診。
科大訊飛與安徽省立醫院等多家一流醫院進行合作,此外訊飛的影像輔助診斷系統還是訊飛人工智能輔助診療中心的重要組成部分,能夠遠程實現對基層醫院的輔助診斷,目前已可實現乳腺鉬靶、肺部CT的輔助診斷。
目前在實際應用中科大訊飛醫學影像智能輔助診斷系統已能在很大程度上能夠輔助醫生工作,減少誤診、漏診。訊飛的人工智能在醫療以及所有的行業中的應用定位是非常明確的,我們的醫學影像輔助診斷系統不是要去代替醫生,是要輔助醫生,從而達到人機協同的效果,大大提升影像診斷準確率。
總結
以上是生活随笔為你收集整理的LUNA再次夺冠,科大讯飞向世界宣告自己的实力不止于语音的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 使用Faster-Rcnn进行目标检测(
- 下一篇: 大数据视觉智能实践及医学影像智能诊断探索