百度ERNIE新突破,登顶中文医疗信息处理权威榜单CBLUE冠军
醫(yī)療領(lǐng)域存在大量的專業(yè)知識和醫(yī)學(xué)術(shù)語,人類經(jīng)過長時間的學(xué)習(xí)才能成為一名優(yōu)秀的醫(yī)生。那機器如何才能“讀懂”醫(yī)療文獻(xiàn)呢?尤其是面對電子病歷、生物醫(yī)療文獻(xiàn)中存在的大量非結(jié)構(gòu)化、非標(biāo)準(zhǔn)化文本,計算機是無法直接使用、處理的。這就需要自然語言處理和知識圖譜技術(shù)大展身手了。
近日,百度 AI 技術(shù)再次取得關(guān)鍵突破,依托百度知識增強語義理解框架 ERNIE 研發(fā)的醫(yī)療預(yù)訓(xùn)練語言模型 ERNIE-Health,以超越人類醫(yī)學(xué)專家水平的成績登頂中文醫(yī)療信息處理權(quán)威榜單 CBLUE 冠軍,驗證了 ERNIE 在醫(yī)療行業(yè)應(yīng)用的重要價值。AI 醫(yī)療邁向新的里程碑。
▲ 中文醫(yī)療信息處理 CBLUE 榜單排名
CBLUE: 檢驗中文醫(yī)療信息處理能力的“金標(biāo)準(zhǔn)”
醫(yī)療文本的處理與理解是醫(yī)療信息化的重要基礎(chǔ),具有非常高的應(yīng)用價值。為構(gòu)建統(tǒng)一共識的醫(yī)療信息系統(tǒng)性能評估平臺,中國中文信息學(xué)會醫(yī)療健康與生物信息處理專業(yè)委員會在合法開放共享的理念下發(fā)起設(shè)立了中文醫(yī)療信息處理挑戰(zhàn)榜 CBLUE (Chinese Biomedical Language Understanding Evaluation)。
CBLUE 是國內(nèi)首個面向中文醫(yī)療文本處理的多任務(wù)榜單,涵蓋了醫(yī)學(xué)信息抽取、醫(yī)學(xué)術(shù)語歸一化、醫(yī)學(xué)文本分類、醫(yī)學(xué)句子關(guān)系判定和醫(yī)學(xué)問答共5大類任務(wù)、8個子任務(wù);其數(shù)據(jù)來源分布廣泛,包括醫(yī)學(xué)教材、電子病歷、臨床試驗公示以及互聯(lián)網(wǎng)用戶真實查詢等。該榜單一經(jīng)推出便受到了學(xué)界和業(yè)界的廣泛關(guān)注,自2021年4月正式上線以來,共吸引近300支隊伍參與打榜,已逐漸發(fā)展成為檢驗 AI 系統(tǒng)中文醫(yī)療信息處理能力的“金標(biāo)準(zhǔn)”。
百度醫(yī)療預(yù)訓(xùn)練語言模型 ERNIE-Health
近日,隨著百度醫(yī)療語言模型預(yù)訓(xùn)練技術(shù)取得關(guān)鍵突破,百度團隊在 CBLUE 榜單上登頂榜首,以8個任務(wù)均分77.808的佳績超越人類醫(yī)學(xué)專家均分77.1的水平[1],標(biāo)志著 AI 醫(yī)療正式邁向新的里程碑。
作為新紀(jì)錄誕生背后的關(guān)鍵技術(shù),百度醫(yī)療預(yù)訓(xùn)練語言模型 ERNIE-Health 功不可沒。ERNIE-Health 依托百度文心 ERNIE 先進(jìn)的知識增強預(yù)訓(xùn)練語言模型打造,通過醫(yī)療知識增強技術(shù)進(jìn)一步學(xué)習(xí)海量的醫(yī)療數(shù)據(jù),精準(zhǔn)地掌握了專業(yè)的醫(yī)學(xué)知識。ERNIE-Health 利用醫(yī)療實體掩碼策略對專業(yè)術(shù)語等實體級知識學(xué)習(xí),學(xué)會了海量的醫(yī)療實體知識。同時,通過醫(yī)療問答匹配任務(wù)學(xué)習(xí)病患病狀描述與醫(yī)生專業(yè)治療方案的對應(yīng)關(guān)系,獲得了醫(yī)療實體知識之間的內(nèi)在聯(lián)系。
ERNIE-Health 共學(xué)習(xí)了60多萬的醫(yī)療專業(yè)術(shù)語和4000多萬的醫(yī)療專業(yè)問答數(shù)據(jù),大幅提升了對醫(yī)療專業(yè)知識的理解和建模能力。此外,ERNIE-Health 還探索了多級語義判別預(yù)訓(xùn)練任務(wù),提升了模型對醫(yī)療知識的學(xué)習(xí)效率。ERNIE-Health 模型也將在隨后正式對外界公開發(fā)布,希望借此進(jìn)一步推動 AI 醫(yī)療技術(shù)的發(fā)展和創(chuàng)新。
▲ ERNIE-Health
百度 AI 推動解決基層醫(yī)療難題 助力健康中國
醫(yī)療資源不均、醫(yī)生供需缺口大、臨床工作壓力持續(xù)增加已經(jīng)成為當(dāng)前我國醫(yī)療衛(wèi)生事業(yè)面臨的突出問題,利用 AI 技術(shù)實現(xiàn)臨床輔助具有重要的現(xiàn)實意義。
百度以循證 AI 為理念,推出 AI 醫(yī)療品牌——靈醫(yī)智惠。靈醫(yī)智惠依托百度自然語言處理與知識圖譜技術(shù)的深厚積累,構(gòu)建了涵蓋醫(yī)學(xué)自然語言理解、醫(yī)學(xué)知識體系、醫(yī)學(xué)認(rèn)知計算三大核心技術(shù)在內(nèi)的循證醫(yī)學(xué)認(rèn)知引擎,并在此基礎(chǔ)上構(gòu)建醫(yī)療 AI 中臺、醫(yī)療知識中臺和醫(yī)療數(shù)據(jù)中臺,面向醫(yī)療場景提供臨床輔助決策、眼底篩查、智慧病案、智能審方、慢病管理、醫(yī)療大數(shù)據(jù)服務(wù)等 AI 醫(yī)療解決方案。
目前,靈醫(yī)智惠在 AI 醫(yī)療領(lǐng)域的產(chǎn)品和解決方案已觸達(dá)29個省市自治區(qū)、400多家醫(yī)院、1600多家基層醫(yī)療機構(gòu),服務(wù)數(shù)萬名醫(yī)生,惠及千萬患者。未來,百度還將持續(xù)推動自然語言處理及知識圖譜等技術(shù)在生物醫(yī)學(xué)領(lǐng)域的技術(shù)創(chuàng)新,用科技的力量提升基層醫(yī)療水平,為更多人提供更高效、更優(yōu)質(zhì)的醫(yī)療服務(wù)。
[1] Ningyu Zhang, Mosha Chen, Zhen Bi, and others. CBLUE: A Chinese biomedical language understanding evaluation benchmark. arXiv preprint arXiv:2106.08087.
點擊進(jìn)入獲得更多技術(shù)信息~~
總結(jié)
以上是生活随笔為你收集整理的百度ERNIE新突破,登顶中文医疗信息处理权威榜单CBLUE冠军的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Paddle.js PaddleCla
- 下一篇: 秒过,度目智慧通行让常态化防疫更高效