信息檢索17-醫(yī)療檢索_第1頁
信息檢索17-醫(yī)療檢索_第2頁
信息檢索17-醫(yī)療檢索_第3頁
信息檢索17-醫(yī)療檢索_第4頁
信息檢索17-醫(yī)療檢索_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第17講MedicalIR醫(yī)療信息檢索12021/10/09提綱2

MedicalIR簡介

TRECCDS任務簡介

常用CDS方法介紹

DNRMforCDS提綱3

MedicalIR簡介

TRECCDS任務簡介

常用CDS方法介紹

DNRMforCDSMedicalIR簡介有很多時候,為了更加準確地做出醫(yī)療決策,醫(yī)生可能需要查閱一些相關的醫(yī)療文獻??紤]到現(xiàn)有醫(yī)療文獻的數(shù)量以及其增長的速度,快速而準確地定位所需要的醫(yī)療文獻變得非常重要。MedicalIR的目標就是根據(jù)醫(yī)生的信息需求〔如電子病歷〕,從海量醫(yī)療文獻中找到盡可能多的相關文獻。與一般的IR任務〔如Web檢索〕相比,MedicalIR任務的查詢和文檔長度都相對長很多;MedicalIR任務的查詢和文檔都較多地包含醫(yī)療領域特定的詞匯和概念。4提綱5

MedicalIR簡介

TRECCDS任務簡介

常用CDS方法介紹

DNRMforCDSTRECCDS任務目的:使醫(yī)療信息更加容易獲取,以及讓電子病歷(EHR)的使用變得更加有意義。TRECClinicalDecisionSupport(CDS)2021&2021A給定電子病歷(EHR)作為查詢,參賽者需要返回相關的醫(yī)療文獻以滿足查詢所包含的信息需求。查詢分為如下三類,每類表示不同的需求類型:Diagnosis::Whatisthepatient’sdiagnosis?Test:Whattestsshouldthepatient’sreceive?Treatment:Howshouldthepatientbetreated?

6常用CDS方法查詢擴展:基于偽相關反響基于外部資源:如MeSH、DBpedia以及UMLS,一般直接將擴展詞/概念參加到查詢中,或者給予擴展詞/概念更高的權重基于Google檢索結果:從排名靠前的(如前10篇)的標題、摘要或者文檔提取擴展詞/概念將查詢類型(Diagnosis,Test,Treatment)作為擴展詞參加查詢Fusion:對多個檢索模型的結果進行合并基于檢索模型評分進行fusion基于排序進行fusion使用專門針對長文檔的檢索模型:如SPUD9常用CDS方法考慮查詢類型信息:首先訓練分類器(如對Diagnosis和非Diagnosis分類),然后對初始檢索結果進行分類,根據(jù)分類得分有一個排序,該排序可以與初始檢索結果排序進行fusion。Re-ranking:基于learning-to-rank:用BM25、PL2和BB2等模型評分作為feature,用randomforest學習pointwise排序模型,或者用RankSVM學習pairwise排序模型,再用學習到的模型對初始檢索結果重排基于position:根據(jù)位置信息為文檔計算一個權重,并與初始評分求和,再對初始檢索結果進行重排序引入語義信息:通過計算查詢與文檔之間的語義相似度評分,然后將該評分與初始檢索評分進行插值,最后對初始檢索結果進行重排10提綱11

MedicalIR簡介

TRECCDS任務簡介

常用CDS方法介紹

DNRMforCDS基于DNN的方法-DNRM考慮到查詢包含的信息較少, 直接計算查詢與文檔之間的相似度不能到達很好的效果;現(xiàn)有的基于DNN的比較有效的檢索模型都需要計算查詢與文檔的單詞-單詞相似度矩陣,計算復雜度較高;并且不考慮反響信息,檢索效果也會受到一定影響;DNRM引入了兩種相似度特征,一是查詢詞與文檔的相似度,二是偽相關反響文檔之間的相似度,然后通過多層感知機(MLP)學習一個評分,一定程度上克服了上述的兩個問題。12IR:一個比照排序的問題哪個卡通形象更可愛?〔哪個文檔更相關?〕轉化為一個相似度計算的問題哪個與“標準答案〞更近似?DNRM根本思想將文檔評分轉化為一個與“標準答案〞計算相似度問題D2Q〔文檔-查詢〕相似度是一種弱匹配信號相對于文檔,查詢太短,覆蓋的信息太少文檔間相似度是一種“軟匹配〔softmatching〕〞,考慮了文檔的所有內容事實上一篇文檔是否相關是由其內容決定的,而不是是否包含查詢關鍵字“標準答案〞由K個初始排名靠前的文檔組成將待評分文檔與這K個文檔的相似度作為K維特征輸入一個前饋網(wǎng)絡前饋網(wǎng)絡輸出最終文檔評分YanhuaRanetal.ADocument-basedNeuralRelevanceModelforEffectiveClinicalDecisionSupport.BIBM2021.Toappear.模型結構 給定查詢q和待排序文檔d,Dq是q的偽相關反響文檔集;通過計算待排序文檔d與各查詢詞qt的相似度得到D2Q特征,通過計算d與偽相關反響文檔文檔di的相似度得到D2D特征;之后將D2Q特征和D2D特征分別輸入到各自的MLP結構得到一個標量評分,然后將這兩個評分合并得到最終語義評分,再將語義評分與初始檢索模型評分線性插值得到最終評分。

DNRM模型結構DNRMforCDS

實驗設置與baselines的比較:BM25,SEM-QD,DRMMDNRM模型多個變種的比較:只使用D2Q評分(DNRMQ);只使用D2D評分(DNRMD);D2D評分且與BM25插值(DNRMD-λ);使用D2Q與D2D評分且與BM25插值(DNRMDQ-λ)

DNRMforCDS

DNRMforCDS

實驗結果實驗結論:在大局部情況下,DNRMD-λ以及DNRMDQ-λ比baselines效果要好;對于長查詢(Description)而言,總體上DNRMDQ-λ要比DNRMD-λ效果要好。DNRM模型能夠取得優(yōu)于BestTRECRun的結果參考文獻SimpsonMS,VoorheesEM,HershW.Overviewofthetrec2021clinicaldecisionsupporttrack[R].LISTERHILLNATIONALCENTERFORBIOMEDICALCOMMUNICATIONSBETHESDAMD,2021.RobertsK,SimpsonMS,VoorheesEM,etal.OverviewoftheTREC2021ClinicalDecisionSupportTrack[C]//TREC.2021.YangC,HeB.Anovelsemantics-basedapproachtomedicalliteraturesearch[C]//BioinformaticsandBiomedicine(BIBM),2021IEEEInternationalConferenceon.IEEE,2021:1616-1623.Balaneshin-KordanS,KotovA,XistoR.WSU-IRatTREC2021clinicaldecisionsupporttrack:Jointweightingofexplicitandlatentmedicalqueryconceptsfromdiversesources[R].WayneStateUniversityDetroitUnitedStates,2021.SongY,HeY,HuQ,etal.Ecnuat2021cdstrack:Twore-rankingmethodsinmedicalinformationretrieval[C]//Proceedingsofthe2021TextRetrievalConference.2021.參考文獻ChoiS,ChoiJ.SNUMedinfoatTRECCDStrack2021:Medicalcase-basedretrievaltask[R].SEOULNATIONALUNIV(REPUBLICOFKOREA),2021.CumminsR.ClinicalDecisionSupportwiththeSPUDLanguageModel[C]//TREC.2021.AbachaAB,KhelifiS.LISTatTREC2021ClinicalDecisionSupport

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論