




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
XML數(shù)據(jù)管理技術(shù)周軍鋒12/17/20221共2頁XML數(shù)據(jù)管理技術(shù)周軍鋒12/16/20221共2頁大綱簡介流程內(nèi)容總結(jié)12/17/20222大綱簡介12/16/20222大綱簡介流程內(nèi)容總結(jié)12/17/20223大綱簡介12/16/20223綜述簡介——必要性XML數(shù)據(jù)大量涌現(xiàn)Gartner[1]預(yù)測,XML文件的使用率在2007年達(dá)到40%,2008年將占據(jù)支配地位IDC(國際數(shù)據(jù)公司)報告顯示,在500家受訪企業(yè)的IT部門中,有29%正在大量使用XML數(shù)據(jù)庫XML研究如火如荼每年各種學(xué)術(shù)會議期刊發(fā)表XML相關(guān)論文多達(dá)300篇沒有系統(tǒng)的總結(jié)和比較發(fā)表時間早:大部分出現(xiàn)在06年左右內(nèi)容局限性:主要涉及查詢,索引[1].in/summit/eform/technical-papers/gartneruseofxml.pdf/view12/17/20224綜述簡介——必要性XML數(shù)據(jù)大量涌現(xiàn)12/16/20224綜述簡介——信息源要求全面性06-08年各種會議期刊國際會議國際期刊國內(nèi)會議國內(nèi)期刊12/17/20225綜述簡介——信息源要求12/16/20225綜述簡介——信息源國際會議(ACM)SIGMOD:(AssociationforComputingMachinery)SpecialInterestGrouponManagementofDataVLDB:InternationalConferenceonVeryLargeDataBasesICDE:InternationalConferenceonDataEngineeringEDBT:InternationalConferenceonExtendingDatabaseTechnologyWWW:InternationalConferenceonWorldWideWebCIKM:InternationalConferenceonInformationandKnowledgeManagementDASFAA:DatabaseSystemsforAdvancedApplicationsER:InternationalConferenceontheEntityRelationshipApproachPODS:SymposiumonPrinciplesofDatabaseSystemsSIGIR:InternationalConferenceonResearchandDevelopmentinInformationRetrievalICDT:InternationalConferenceonDatabaseTheoryDEXA:DatabaseandExpertSystemsApplicationsCIDR:ConferenceonInnovativeDataSystemsResearchWISE:WebInformationSystemsEngineeringWAIM:InternationalConferenceonWeb-AgeInformationManagementAPWeb:Asia-PacificWebConferenceWebDB:InternationalWorkshopontheWebandDatabasesINEX:INitiativefortheEvaluationofXMLRetrievalXIME-P:WorkshoponXQueryIMplementation,ExperienceandPerspectivesXSym:InternationalXMLDatabaseSymposium(08年不存在了)XMLConference:應(yīng)用相關(guān)的會議關(guān)注的會議較好的workshop12/17/20226綜述簡介——信息源國際會議關(guān)注的會議較好的workshop1綜述簡介——信息源國際期刊VLDBJ:TheVLDBJournal
TODS:ACMTransactionsonDatabaseSystems
TKDE
:IEEETransactionsonKnowledgeandDataEngineeringTOIS:ACMTransactionsonInformationSystems
JACM
:JournaloftheACM
CACM
:CommunicationsoftheACM
IS:InformationSystemIR:InformationRetrievalKIS:KnowledgeandInformationSystemSIGMOD-Record
DKE:Data&KnowledgeEngineering
JDM:JournalofDatabaseManagement
WWWJ:WorldWideWeb
JCST:JournalofComputerScienceandTechnology
12/17/20227綜述簡介——信息源國際期刊12/16/20227綜述簡介——信息源國內(nèi)會議NDBC國內(nèi)期刊計算機學(xué)報軟件學(xué)報計算機研究與發(fā)展計算機科學(xué)與探索12/17/20228綜述簡介——信息源國內(nèi)會議12/16/20228綜述簡介——內(nèi)容提煉12/17/20229綜述簡介——內(nèi)容提煉12/16/20229綜述簡介——內(nèi)容提煉如何壓縮內(nèi)容?06-08:200/812,2005年以前的?已有綜述中闡述的內(nèi)容,直接引用并總結(jié)對所有新內(nèi)容分類整理,得到需要的類別對每一類中的文章,去除重復(fù)文章盡量引用大會文章12/17/202210綜述簡介——內(nèi)容提煉如何壓縮內(nèi)容?12/16/202210綜述簡介——內(nèi)容提煉分類整理,去除重復(fù):150/360/700/80012/17/202211綜述簡介——內(nèi)容提煉分類整理,去除重復(fù):150/360/70大綱簡介流程內(nèi)容總結(jié)12/17/202212大綱簡介12/16/202212綜述流程DataStorageManagerDataManagerSchemaManagerIndexManagerXMLDataXMLQueryQueryResultExecuteEngineDataDefinitionXQueryXPath…Keyword建立數(shù)據(jù)庫導(dǎo)入/出文檔執(zhí)行查詢12/17/202213綜述流程DataStorageManagerDat綜述流程DataStorageManagerDataManagerSchemaManagerIndexManagerXMLDataXMLQueryQueryResultExecuteEngineDataDefinitionXQueryXPath…Keyword建立數(shù)據(jù)庫12/17/202214綜述流程DataStorageManagerDat綜述流程DataStorageManagerDataManagerSchemaManagerIndexManagerXMLDataXMLQueryQueryResultExecuteEngineDataDefinitionXQueryXPath…Keyword建立數(shù)據(jù)庫導(dǎo)入/出文檔12/17/202215綜述流程DataStorageManagerDat綜述流程DataStorageManagerDataManagerSchemaManagerIndexManagerXMLDataXMLQueryQueryResultExecuteEngineDataDefinitionXQueryXPath…Keyword建立數(shù)據(jù)庫導(dǎo)入/出文檔執(zhí)行查詢QueryParserQueryOptimizerQueryEvaluatorExecuteEnginePeople/person/profile/gender12/17/202216綜述流程DataStorageManagerDat綜述流程DataStorageManagerDataManagerSchemaManagerIndexManagerXMLDataXMLQueryQueryResultExecuteEngineDataDefinitionXQueryXPath…Keyword研究點存儲存儲策略編碼方案索引查詢查詢改寫查詢優(yōu)化查詢算法12/17/202217綜述流程DataStorageManagerDat大綱簡介流程內(nèi)容總結(jié)12/17/202218大綱簡介12/16/202218內(nèi)容介紹存儲存儲策略編碼方案索引查詢查詢改寫查詢優(yōu)化查詢算法12/17/202219內(nèi)容介紹存儲12/16/202219存儲策略關(guān)系表查詢導(dǎo)出文檔Native方式混合方式問題Benchmark文檔類型文本數(shù)據(jù)。。。attributesvaluenameid12/17/202220存儲策略關(guān)系表。。。attributesvaluenamei內(nèi)容介紹存儲存儲策略編碼方案索引查詢查詢改寫查詢優(yōu)化查詢算法12/17/202221內(nèi)容介紹存儲12/16/202221編碼方案為什么使用編碼導(dǎo)航不可行a1b1b2b3c1d1d2e1f1adQueryDocument如何判斷元素之間的關(guān)系?aa1dd1d2僅處理tag名為a和d的元素,可以減少處理的元素數(shù)量12/17/202222編碼方案為什么使用編碼a1b1b2b3c1d1d2e1f1a編碼方案為什么使用編碼已有的解決方案區(qū)間編碼a1b1b2b3c1d1d2e1f1adQueryDocument(1,,1)(start,end,level)(2,,2)3(4,,2)(5,,3)6(7,,3)89(10,,2)11(12,,2)17(13,,3)14(15,,3)16181185678ad(1,18,1)(5,6,3)(7,8,3)12/17/202223編碼方案為什么使用編碼a1b1b2b3c1d1d2e1f1a編碼方案為什么使用編碼已有的解決方案區(qū)間編碼路徑編碼a1b1b2b3c1d1d2e1f1adQueryDocumentad..1.4.212/17/202224編碼方案為什么使用編碼a1b1b2b3c1d1d2e1f1a編碼方案為什么使用編碼已有的解決方案實際問題文檔更新插入葉子節(jié)點插入非葉子節(jié)點節(jié)點編碼需要更新adQueryDocumenta1b1b2b3c1d1d2e1f1(1,,1)(2,,2)3(4,,2)(5,,3)6(7,,3)89(10,,2)11(12,,2)17(13,,3)14(15,,3)1618ga1b1b2b3c1d1d2e1f.1.4.2gggg12/17/202225編碼方案為什么使用編碼adQueryDocumenta1b1編碼方案為什么使用編碼已有的解決方案已有更新方法空間預(yù)留無法避免重新編碼adQueryDocumenta1b1b2b3c1d1d2e1f1(10,,1)(20,,2)30(40,,2)(50,,3)60(70,,3)8090(100,,2)110(120,,2)170(130,,3)140(150,,3)16018012/17/202226編碼方案為什么使用編碼adQueryDocumenta1b1編碼方案為什么使用編碼已有的解決方案已有更新方法空間預(yù)留浮點數(shù)編碼無法避免重新編碼adQueryDocumenta1b1b2b3c1d1d2e1f1(1,,1)(2,,2)3(4,,2)(5,,3)6(7,,3)89(10,,2)11(12,,2)17(13,,3)14(15,,3)1618g1g2(110.01,110.11,3)(101,110,3)(111,1000,3)(110.1101,110.1111,3)12/17/202227編碼方案為什么使用編碼adQueryDocumenta1b1編碼方案為什么使用編碼已有的解決方案已有更新方法空間預(yù)留浮點數(shù)編碼路徑編碼ORDPATH代價高a1b1b2b4c1d1d2e1f1a1b1b4c1e1f.3b21.2.1d1d2b21.2.3b312/17/202228編碼方案為什么使用編碼a1b1b2b4c1d1d2e1f1a編碼方案為什么使用編碼已有的解決方案已有更新方法空間預(yù)留浮點數(shù)編碼路徑編碼素數(shù)編碼可避免更新編碼N值計算代價高a1b2c1d1d2e1f112357111312=2*16=3*210=5*27=7*177=11*791=13*7d117170=17*10N1=1523N2=6N1=1139N2=7272NNNNN345NNNNN12/17/202229編碼方案為什么使用編碼a1b2c1d1d2e1f112357編碼方案為什么使用編碼已有的解決方案已有更新方法空間預(yù)留浮點數(shù)編碼路徑編碼素數(shù)編碼二進制位串將整數(shù)用二進制字符串表示a1b1b2b3c1d1d2e1f1(1,,1)(2,,2)3(4,,2)(5,,3)6(7,,3)89(10,,2)11(12,,2)17(13,,3)14(15,,3)1618將插入整數(shù)變?yōu)椴迦胱址?size=019size=0(01,01001,001)(0101,011,001)g(010011,0100111,001)12/17/202230編碼方案為什么使用編碼將整數(shù)用二進制字符串表示a1b1b2b編碼方案為什么使用編碼已有的解決方案已有更新方法空間預(yù)留浮點數(shù)編碼路徑編碼素數(shù)編碼位串編碼向量編碼將整數(shù)用向量表示a1b1b2b3c1d1d2e1f1(1,,1)(2,,2)3(4,,2)(5,,3)6(7,,3)89(10,,2)11(12,,2)17(13,,3)14(15,,3)1618將插入整數(shù)變?yōu)椴迦胂蛄?2/17/202231編碼方案為什么使用編碼將整數(shù)用向量表示a1b1b2b3c1d編碼方案為什么使用編碼已有的解決方案已有更新方法空間預(yù)留浮點數(shù)編碼路徑編碼素數(shù)編碼位串編碼向量編碼a1b1b2b3c1d1d2e1f1(1,,1)(2,,2)3(4,,2)(5,,3)6(7,,3)89(10,,2)11(12,,2)17(13,,3)14(15,,3)161812/17/202232編碼方案為什么使用編碼a1b1b2b3c1d1d2e1f1(編碼方案為什么使用編碼已有的解決方案已有更新方法空間預(yù)留浮點數(shù)編碼路徑編碼素數(shù)編碼位串編碼向量編碼a1b1b2b3c1d1d2e1f1(1,,1)(2,,2)3(4,,2)(5,,3)6(7,,3)89(10,,2)11(12,,2)17(13,,3)14(15,,3)161818=(0,1)1=(1,0)10=(1,1)6=(2,1)14=(1,2)((2,5),(2,1),3)((5,3),(3,2),3)12/17/202233編碼方案為什么使用編碼a1b1b2b3c1d1d2e1f1(編碼方案為什么使用編碼已有的解決方案已有更新方法基于圖的編碼不支持更新12/17/202234編碼方案為什么使用編碼12/16/202234編碼方案為什么使用編碼已有的解決方案已有更新方法基于圖的編碼不支持更新支持更新12/17/202235編碼方案為什么使用編碼12/16/202235編碼方案為什么使用編碼已有的解決方案實際問題可能的研究點樹上編碼的更新什么情況下可在兩個值之間插入無窮多個值圖上編碼的更新如何將不同區(qū)間用一個值表示a1d2d112/17/202236編碼方案為什么使用編碼a1d2d112/16/202236內(nèi)容介紹存儲存儲策略編碼方案索引查詢查詢改寫查詢優(yōu)化查詢算法12/17/202237內(nèi)容介紹存儲12/16/202237索引為什么使用索引a1b1b2b3c1d1d2e1f1adQueryDocumentaa1dd1d212/17/202238索引為什么使用索引a1b1b2b3c1d1d2e1f1adQ索引為什么使用索引索引的類型結(jié)構(gòu)索引Tag索引Structuralsummary值索引倒排表a1b1b2d3c1d1d2e1f1bdQueryDocumentbb1dd1d2b2bb1dd1d2b2d3abcdefd12/17/202239索引為什么使用索引a1b1b2d3c1d1d2e1f1bdQ索引為什么使用索引索引的類型結(jié)構(gòu)索引F&Bindex1-index12/17/202240索引為什么使用索引12/16/202240索引為什么使用索引索引的類型結(jié)構(gòu)索引F&Bindex1-indexBDCBD12/17/202241索引為什么使用索引BDCBD12/16/202241內(nèi)容介紹存儲存儲策略編碼方案索引查詢查詢改寫查詢優(yōu)化查詢算法12/17/202242內(nèi)容介紹存儲12/16/202242查詢改寫什么是查詢改寫用戶提交查詢Q系統(tǒng)處理Q’12/17/202243查詢改寫什么是查詢改寫12/16/202243查詢改寫什么是查詢改寫為什么要查詢改寫用戶提交的查詢表達(dá)能力有限:關(guān)鍵字查詢用戶提交的查詢有誤a1b1b2d3c1d1d2e1f112/17/202244查詢改寫什么是查詢改寫a1b1b2d3c1d1d2e1f11查詢改寫什么是查詢改寫為什么要查詢改寫查詢改寫的方式基于用戶反饋結(jié)果反饋查詢反饋隱式反饋:無用戶參與12/17/202245查詢改寫什么是查詢改寫12/16/2022451234…XMLXMLIRIRindexindexFaginIRindex用戶反饋2.Usermarksrelevantand
nonrelevantdocs3.Systemfindsbesttermstodistinguishbetweenrelevantandnonrelevantdocs4.Systemsubmitsexpanded
query1.UsersubmitsqueryqueryevaluationXML
not(Fagin)FeedbackforXMLIR:StartwithkeywordqueryFindstructuralexpansionsCreatestructuralquery12/17/2022461234…XMLXMLIRIRindexindexFaginTag+Contentofother
elementsinthedocumentD://author[Baeza]
//citation[Abiteboul]Usermarks
relevantresultPathto
theresultP:article/body/sec/subsec用戶反饋sec?Semistructureddata…“articlebodysecsubsec
?XMLhasevolved…“frontmatterbackmattersecsubsecppp
?WiththeadventofXSLT…“author
?Baeza-Yates“Contentof
resultPossibledimensions:C:XMLcitation
?SergeAbiteboul“12/17/202247Tag+Contentofother
elements用戶反饋XMLSearch
EnginefeedbackScoring+RerankingexpandedqueryqueryresultsrerankedresultsContentModulePathModuleDocModule…FeedbackDimensionsquery+results12/17/202248用戶反饋XMLSearch
EnginefeedbackS查詢改寫什么是查詢改寫為什么要查詢改寫查詢改寫的方式基于用戶反饋偽反饋又稱局部反饋、盲反饋,它假設(shè)初始檢索結(jié)果的前面若干篇文檔是相關(guān)的,然后利用標(biāo)準(zhǔn)的相關(guān)反饋過程進行查詢擴展隱式反饋用戶不主動參與反饋,但是系統(tǒng)仍需要從用戶的瀏覽行為中分析得到一些有用的信息用來確定用戶興趣模式,從而推理出描述用戶查詢需求的表達(dá)式,并據(jù)此進行檢索.查詢擴展黃靜的工作12/17/202249查詢改寫什么是查詢改寫12/16/202249內(nèi)容介紹存儲存儲策略編碼方案索引查詢查詢改寫查詢優(yōu)化查詢算法12/17/202250內(nèi)容介紹存儲12/16/202250查詢優(yōu)化種類邏輯優(yōu)化物理優(yōu)化12/17/202251查詢優(yōu)化種類12/16/202251查詢優(yōu)化邏輯優(yōu)化語法優(yōu)化語義優(yōu)化12/17/202252查詢優(yōu)化邏輯優(yōu)化語法優(yōu)化語義優(yōu)化12/16/202252查詢優(yōu)化物理優(yōu)化代價估計單步代價估計執(zhí)行順序整體代價估計查詢:abcdefd√12/17/202253查詢優(yōu)化物理優(yōu)化查詢:abcdefd√12/16/20225內(nèi)容介紹存儲存儲策略編碼方案索引查詢查詢改寫查詢優(yōu)化查詢算法12/17/202254內(nèi)容介紹存儲12/16/202254查詢算法-Twig查詢處理導(dǎo)航式a1b1b2b3c1d1d2e1f1adQueryDocument12/17/202255查詢算法-Twig查詢處理導(dǎo)航式a1b1b2b3c1d1d2查詢算法-Twig查詢處理導(dǎo)航式結(jié)構(gòu)連接二元Path連接整體匹配abdcabbdaca1b1b2b3c1d1d2e1f13212abdac21大量中間結(jié)果12/17/202256查詢算法-Twig查詢處理導(dǎo)航式abdcabbdaca1b1查詢算法-Twig查詢處理導(dǎo)航式結(jié)構(gòu)連接二元Path連接整體匹配adrd1a1a3a5a2a4f1d2d3a6d4d5d6a3a4d2d3a6d4d5cursorMarkada1(7,20)a2(14,19)a3(21,28)a4(22,27)a5(29,31)a6(32,40)d1(2,4)d2(23,24)d3(25,26)d4(33,34)d5(37,38)d6(43,44)a3d2a3d3a4d2a4d3a6d4a6d5后代指針回指為什么?12/17/202257查詢算法-Twig查詢處理導(dǎo)航式adrd1a1a3a5a2a查詢算法-Twig查詢處理導(dǎo)航式結(jié)構(gòu)連接二元Path連接整體匹配adrd1a1a3a5a2a4f1d2d3a6d4d5d6a3a4d2d3a6d4d5ada1(7,20)a2(14,19)a3(21,28)a4(22,27)a5(29,31)a6(32,40)d1(2,4)d2(23,24)d3(25,26)d4(33,34)d5(37,38)d6(43,44)a3d2a3d3a4d2a4d3a6d4a6d5a1(7,20)a2(14,19)a3(21,28)a4(22,27)a5(29,31)a6(32,40)12/17/202258查詢算法-Twig查詢處理導(dǎo)航式adrd1a1a3a5a2a查詢算法-Twig查詢處理導(dǎo)航式結(jié)構(gòu)連接二元Path連接整體匹配A1B1A2B2C1ABCXMLDocQueryA1A2B1B2C1Result:A1B1C1A1B2C1A2B2C1SCSBSA12/17/202259查詢算法-Twig查詢處理導(dǎo)航式A1B1A2B2C1ABCX查詢算法-Twig查詢處理導(dǎo)航式結(jié)構(gòu)連接二元Path連接整體匹配12/17/202260查詢算法-Twig查詢處理導(dǎo)航式12/16/202260查詢算法-Twig查詢處理導(dǎo)航式結(jié)構(gòu)連接二元Path連接整體匹配a7c12c8b4a7c8a7b4c9a7c9c10a7c10c11a7c11b5a7b5a7c12StackaStackbStackcResultofA//CResultofA//B12/17/202261查詢算法-Twig查詢處理導(dǎo)航式a7c12c8b4a7c8大綱簡介流程內(nèi)容展望總結(jié)12/17/202262大綱簡介12/16/202262研究展望編碼:圖上可更新的編碼方案查詢靜態(tài)文檔:關(guān)鍵字查詢,近似查詢數(shù)據(jù)流:關(guān)鍵字查詢,近似查詢數(shù)據(jù)集成概率XML時態(tài)XML數(shù)據(jù)倉庫數(shù)據(jù)挖掘數(shù)據(jù)壓縮分布式XML√√與OrientX不沖突12/17/202263研究展望編碼:圖上可更新的編碼方案√√與OrientX不沖突總結(jié)動機及準(zhǔn)備工作系統(tǒng)架構(gòu)存儲存儲策略編碼方案索引查詢查詢改寫查詢優(yōu)化查詢算法研究展望DataStorageManagerDataManagerSchemaManagerIndexManagerXMLDataXMLQueryQueryResultExecuteEngineDataDefinitionXQueryXPath…Keyword12/17/202264總結(jié)動機及準(zhǔn)備工作DataStorageManagThankyou!12/17/202265Thankyou!12/16/202265XML數(shù)據(jù)管理技術(shù)周軍鋒12/17/202266共2頁XML數(shù)據(jù)管理技術(shù)周軍鋒12/16/20221共2頁大綱簡介流程內(nèi)容總結(jié)12/17/202267大綱簡介12/16/20222大綱簡介流程內(nèi)容總結(jié)12/17/202268大綱簡介12/16/20223綜述簡介——必要性XML數(shù)據(jù)大量涌現(xiàn)Gartner[1]預(yù)測,XML文件的使用率在2007年達(dá)到40%,2008年將占據(jù)支配地位IDC(國際數(shù)據(jù)公司)報告顯示,在500家受訪企業(yè)的IT部門中,有29%正在大量使用XML數(shù)據(jù)庫XML研究如火如荼每年各種學(xué)術(shù)會議期刊發(fā)表XML相關(guān)論文多達(dá)300篇沒有系統(tǒng)的總結(jié)和比較發(fā)表時間早:大部分出現(xiàn)在06年左右內(nèi)容局限性:主要涉及查詢,索引[1].in/summit/eform/technical-papers/gartneruseofxml.pdf/view12/17/202269綜述簡介——必要性XML數(shù)據(jù)大量涌現(xiàn)12/16/20224綜述簡介——信息源要求全面性06-08年各種會議期刊國際會議國際期刊國內(nèi)會議國內(nèi)期刊12/17/202270綜述簡介——信息源要求12/16/20225綜述簡介——信息源國際會議(ACM)SIGMOD:(AssociationforComputingMachinery)SpecialInterestGrouponManagementofDataVLDB:InternationalConferenceonVeryLargeDataBasesICDE:InternationalConferenceonDataEngineeringEDBT:InternationalConferenceonExtendingDatabaseTechnologyWWW:InternationalConferenceonWorldWideWebCIKM:InternationalConferenceonInformationandKnowledgeManagementDASFAA:DatabaseSystemsforAdvancedApplicationsER:InternationalConferenceontheEntityRelationshipApproachPODS:SymposiumonPrinciplesofDatabaseSystemsSIGIR:InternationalConferenceonResearchandDevelopmentinInformationRetrievalICDT:InternationalConferenceonDatabaseTheoryDEXA:DatabaseandExpertSystemsApplicationsCIDR:ConferenceonInnovativeDataSystemsResearchWISE:WebInformationSystemsEngineeringWAIM:InternationalConferenceonWeb-AgeInformationManagementAPWeb:Asia-PacificWebConferenceWebDB:InternationalWorkshopontheWebandDatabasesINEX:INitiativefortheEvaluationofXMLRetrievalXIME-P:WorkshoponXQueryIMplementation,ExperienceandPerspectivesXSym:InternationalXMLDatabaseSymposium(08年不存在了)XMLConference:應(yīng)用相關(guān)的會議關(guān)注的會議較好的workshop12/17/202271綜述簡介——信息源國際會議關(guān)注的會議較好的workshop1綜述簡介——信息源國際期刊VLDBJ:TheVLDBJournal
TODS:ACMTransactionsonDatabaseSystems
TKDE
:IEEETransactionsonKnowledgeandDataEngineeringTOIS:ACMTransactionsonInformationSystems
JACM
:JournaloftheACM
CACM
:CommunicationsoftheACM
IS:InformationSystemIR:InformationRetrievalKIS:KnowledgeandInformationSystemSIGMOD-Record
DKE:Data&KnowledgeEngineering
JDM:JournalofDatabaseManagement
WWWJ:WorldWideWeb
JCST:JournalofComputerScienceandTechnology
12/17/202272綜述簡介——信息源國際期刊12/16/20227綜述簡介——信息源國內(nèi)會議NDBC國內(nèi)期刊計算機學(xué)報軟件學(xué)報計算機研究與發(fā)展計算機科學(xué)與探索12/17/202273綜述簡介——信息源國內(nèi)會議12/16/20228綜述簡介——內(nèi)容提煉12/17/202274綜述簡介——內(nèi)容提煉12/16/20229綜述簡介——內(nèi)容提煉如何壓縮內(nèi)容?06-08:200/812,2005年以前的?已有綜述中闡述的內(nèi)容,直接引用并總結(jié)對所有新內(nèi)容分類整理,得到需要的類別對每一類中的文章,去除重復(fù)文章盡量引用大會文章12/17/202275綜述簡介——內(nèi)容提煉如何壓縮內(nèi)容?12/16/202210綜述簡介——內(nèi)容提煉分類整理,去除重復(fù):150/360/700/80012/17/202276綜述簡介——內(nèi)容提煉分類整理,去除重復(fù):150/360/70大綱簡介流程內(nèi)容總結(jié)12/17/202277大綱簡介12/16/202212綜述流程DataStorageManagerDataManagerSchemaManagerIndexManagerXMLDataXMLQueryQueryResultExecuteEngineDataDefinitionXQueryXPath…Keyword建立數(shù)據(jù)庫導(dǎo)入/出文檔執(zhí)行查詢12/17/202278綜述流程DataStorageManagerDat綜述流程DataStorageManagerDataManagerSchemaManagerIndexManagerXMLDataXMLQueryQueryResultExecuteEngineDataDefinitionXQueryXPath…Keyword建立數(shù)據(jù)庫12/17/202279綜述流程DataStorageManagerDat綜述流程DataStorageManagerDataManagerSchemaManagerIndexManagerXMLDataXMLQueryQueryResultExecuteEngineDataDefinitionXQueryXPath…Keyword建立數(shù)據(jù)庫導(dǎo)入/出文檔12/17/202280綜述流程DataStorageManagerDat綜述流程DataStorageManagerDataManagerSchemaManagerIndexManagerXMLDataXMLQueryQueryResultExecuteEngineDataDefinitionXQueryXPath…Keyword建立數(shù)據(jù)庫導(dǎo)入/出文檔執(zhí)行查詢QueryParserQueryOptimizerQueryEvaluatorExecuteEnginePeople/person/profile/gender12/17/202281綜述流程DataStorageManagerDat綜述流程DataStorageManagerDataManagerSchemaManagerIndexManagerXMLDataXMLQueryQueryResultExecuteEngineDataDefinitionXQueryXPath…Keyword研究點存儲存儲策略編碼方案索引查詢查詢改寫查詢優(yōu)化查詢算法12/17/202282綜述流程DataStorageManagerDat大綱簡介流程內(nèi)容總結(jié)12/17/202283大綱簡介12/16/202218內(nèi)容介紹存儲存儲策略編碼方案索引查詢查詢改寫查詢優(yōu)化查詢算法12/17/202284內(nèi)容介紹存儲12/16/202219存儲策略關(guān)系表查詢導(dǎo)出文檔Native方式混合方式問題Benchmark文檔類型文本數(shù)據(jù)。。。attributesvaluenameid12/17/202285存儲策略關(guān)系表。。。attributesvaluenamei內(nèi)容介紹存儲存儲策略編碼方案索引查詢查詢改寫查詢優(yōu)化查詢算法12/17/202286內(nèi)容介紹存儲12/16/202221編碼方案為什么使用編碼導(dǎo)航不可行a1b1b2b3c1d1d2e1f1adQueryDocument如何判斷元素之間的關(guān)系?aa1dd1d2僅處理tag名為a和d的元素,可以減少處理的元素數(shù)量12/17/202287編碼方案為什么使用編碼a1b1b2b3c1d1d2e1f1a編碼方案為什么使用編碼已有的解決方案區(qū)間編碼a1b1b2b3c1d1d2e1f1adQueryDocument(1,,1)(start,end,level)(2,,2)3(4,,2)(5,,3)6(7,,3)89(10,,2)11(12,,2)17(13,,3)14(15,,3)16181185678ad(1,18,1)(5,6,3)(7,8,3)12/17/202288編碼方案為什么使用編碼a1b1b2b3c1d1d2e1f1a編碼方案為什么使用編碼已有的解決方案區(qū)間編碼路徑編碼a1b1b2b3c1d1d2e1f1adQueryDocumentad..1.4.212/17/202289編碼方案為什么使用編碼a1b1b2b3c1d1d2e1f1a編碼方案為什么使用編碼已有的解決方案實際問題文檔更新插入葉子節(jié)點插入非葉子節(jié)點節(jié)點編碼需要更新adQueryDocumenta1b1b2b3c1d1d2e1f1(1,,1)(2,,2)3(4,,2)(5,,3)6(7,,3)89(10,,2)11(12,,2)17(13,,3)14(15,,3)1618ga1b1b2b3c1d1d2e1f.1.4.2gggg12/17/202290編碼方案為什么使用編碼adQueryDocumenta1b1編碼方案為什么使用編碼已有的解決方案已有更新方法空間預(yù)留無法避免重新編碼adQueryDocumenta1b1b2b3c1d1d2e1f1(10,,1)(20,,2)30(40,,2)(50,,3)60(70,,3)8090(100,,2)110(120,,2)170(130,,3)140(150,,3)16018012/17/202291編碼方案為什么使用編碼adQueryDocumenta1b1編碼方案為什么使用編碼已有的解決方案已有更新方法空間預(yù)留浮點數(shù)編碼無法避免重新編碼adQueryDocumenta1b1b2b3c1d1d2e1f1(1,,1)(2,,2)3(4,,2)(5,,3)6(7,,3)89(10,,2)11(12,,2)17(13,,3)14(15,,3)1618g1g2(110.01,110.11,3)(101,110,3)(111,1000,3)(110.1101,110.1111,3)12/17/202292編碼方案為什么使用編碼adQueryDocumenta1b1編碼方案為什么使用編碼已有的解決方案已有更新方法空間預(yù)留浮點數(shù)編碼路徑編碼ORDPATH代價高a1b1b2b4c1d1d2e1f1a1b1b4c1e1f.3b21.2.1d1d2b21.2.3b312/17/202293編碼方案為什么使用編碼a1b1b2b4c1d1d2e1f1a編碼方案為什么使用編碼已有的解決方案已有更新方法空間預(yù)留浮點數(shù)編碼路徑編碼素數(shù)編碼可避免更新編碼N值計算代價高a1b2c1d1d2e1f112357111312=2*16=3*210=5*27=7*177=11*791=13*7d117170=17*10N1=1523N2=6N1=1139N2=7272NNNNN345NNNNN12/17/202294編碼方案為什么使用編碼a1b2c1d1d2e1f112357編碼方案為什么使用編碼已有的解決方案已有更新方法空間預(yù)留浮點數(shù)編碼路徑編碼素數(shù)編碼二進制位串將整數(shù)用二進制字符串表示a1b1b2b3c1d1d2e1f1(1,,1)(2,,2)3(4,,2)(5,,3)6(7,,3)89(10,,2)11(12,,2)17(13,,3)14(15,,3)1618將插入整數(shù)變?yōu)椴迦胱址?size=019size=0(01,01001,001)(0101,011,001)g(010011,0100111,001)12/17/202295編碼方案為什么使用編碼將整數(shù)用二進制字符串表示a1b1b2b編碼方案為什么使用編碼已有的解決方案已有更新方法空間預(yù)留浮點數(shù)編碼路徑編碼素數(shù)編碼位串編碼向量編碼將整數(shù)用向量表示a1b1b2b3c1d1d2e1f1(1,,1)(2,,2)3(4,,2)(5,,3)6(7,,3)89(10,,2)11(12,,2)17(13,,3)14(15,,3)1618將插入整數(shù)變?yōu)椴迦胂蛄?2/17/202296編碼方案為什么使用編碼將整數(shù)用向量表示a1b1b2b3c1d編碼方案為什么使用編碼已有的解決方案已有更新方法空間預(yù)留浮點數(shù)編碼路徑編碼素數(shù)編碼位串編碼向量編碼a1b1b2b3c1d1d2e1f1(1,,1)(2,,2)3(4,,2)(5,,3)6(7,,3)89(10,,2)11(12,,2)17(13,,3)14(15,,3)161812/17/202297編碼方案為什么使用編碼a1b1b2b3c1d1d2e1f1(編碼方案為什么使用編碼已有的解決方案已有更新方法空間預(yù)留浮點數(shù)編碼路徑編碼素數(shù)編碼位串編碼向量編碼a1b1b2b3c1d1d2e1f1(1,,1)(2,,2)3(4,,2)(5,,3)6(7,,3)89(10,,2)11(12,,2)17(13,,3)14(15,,3)161818=(0,1)1=(1,0)10=(1,1)6=(2,1)14=(1,2)((2,5),(2,1),3)((5,3),(3,2),3)12/17/202298編碼方案為什么使用編碼a1b1b2b3c1d1d2e1f1(編碼方案為什么使用編碼已有的解決方案已有更新方法基于圖的編碼不支持更新12/17/202299編碼方案為什么使用編碼12/16/202234編碼方案為什么使用編碼已有的解決方案已有更新方法基于圖的編碼不支持更新支持更新12/17/2022100編碼方案為什么使用編碼12/16/202235編碼方案為什么使用編碼已有的解決方案實際問題可能的研究點樹上編碼的更新什么情況下可在兩個值之間插入無窮多個值圖上編碼的更新如何將不同區(qū)間用一個值表示a1d2d112/17/2022101編碼方案為什么使用編碼a1d2d112/16/202236內(nèi)容介紹存儲存儲策略編碼方案索引查詢查詢改寫查詢優(yōu)化查詢算法12/17/2022102內(nèi)容介紹存儲12/16/202237索引為什么使用索引a1b1b2b3c1d1d2e1f1adQueryDocumentaa1dd1d212/17/2022103索引為什么使用索引a1b1b2b3c1d1d2e1f1adQ索引為什么使用索引索引的類型結(jié)構(gòu)索引Tag索引Structuralsummary值索引倒排表a1b1b2d3c1d1d2e1f1bdQueryDocumentbb1dd1d2b2bb1dd1d2b2d3abcdefd12/17/2022104索引為什么使用索引a1b1b2d3c1d1d2e1f1bdQ索引為什么使用索引索引的類型結(jié)構(gòu)索引F&Bindex1-index12/17/2022105索引為什么使用索引12/16/202240索引為什么使用索引索引的類型結(jié)構(gòu)索引F&Bindex1-indexBDCBD12/17/2022106索引為什么使用索引BDCBD12/16/202241內(nèi)容介紹存儲存儲策略編碼方案索引查詢查詢改寫查詢優(yōu)化查詢算法12/17/2022107內(nèi)容介紹存儲12/16/202242查詢改寫什么是查詢改寫用戶提交查詢Q系統(tǒng)處理Q’12/17/2022108查詢改寫什么是查詢改寫12/16/202243查詢改寫什么是查詢改寫為什么要查詢改寫用戶提交的查詢表達(dá)能力有限:關(guān)鍵字查詢用戶提交的查詢有誤a1b1b2d3c1d1d2e1f112/17/2022109查詢改寫什么是查詢改寫a1b1b2d3c1d1d2e1f11查詢改寫什么是查詢改寫為什么要查詢改寫查詢改寫的方式基于用戶反饋結(jié)果反饋查詢反饋隱式反饋:無用戶參與12/17/2022110查詢改寫什么是查詢改寫12/16/2022451234…XMLXMLIRIRindexindexFaginIRindex用戶反饋2.Usermarksrelevantand
nonrelevantdocs3.Systemfindsbesttermstodistinguishbetweenrelevantandnonrelevantdocs4.Systemsubmitsexpanded
query1.UsersubmitsqueryqueryevaluationXML
not(Fagin)FeedbackforXMLIR:StartwithkeywordqueryFindstructuralexpansionsCreatestructuralquery12/17/20221111234…XMLXMLIRIRindexindexFaginTag+Contentofother
elementsinthedocumentD://author[Baeza]
//citation[Abiteboul]Usermarks
relevantresultPathto
theresultP:article/body/sec/subsec用戶反饋sec?Semistructureddata…“articlebodysecsubsec
?XMLhasevolved…“frontmatterbackmattersecsubsecppp
?WiththeadventofXSLT…“author
?Baeza-Yates“Contentof
resultPossibledimensions:C:XMLcitation
?SergeAbiteboul“12/17/2022112Tag+Contentofother
elements用戶反饋XMLSearch
EnginefeedbackScoring+RerankingexpandedqueryqueryresultsrerankedresultsContentModulePathModuleDocModule…FeedbackDimensionsquery+results12/17/2022113用戶反饋XMLSearch
EnginefeedbackS查詢改寫什么是查詢改寫為什么要查詢改寫查詢改寫的方式基于用戶反饋偽
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中介臨時勞動合同范例
- 協(xié)議購車合同范本
- 專業(yè)監(jiān)理安裝合同范本
- 吉利采購合同范本
- 廠房賃合同范本
- 雙向貿(mào)易合同范例
- 吊車司機勞動合同范例
- 企業(yè)委托經(jīng)營合同范例
- 公司簽用人合同范本
- 協(xié)意合同范本
- QBT 2605-2003 工業(yè)氯化鎂行業(yè)標(biāo)準(zhǔn)
- 2024年江西機電職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫帶答案
- 《拒絕沉迷手機遠(yuǎn)離“垃圾快樂”》班會課件
- 普通高中政治課程標(biāo)準(zhǔn)測試題及答案
- 2024年知識競賽-《民用爆炸物品安全管理條例》知識競賽筆試參考題庫含答案
- 屋頂 屋頂?shù)呐潘O(shè)計 屋頂?shù)呐潘绞剑ńㄖ?gòu)造)
- Web-of-sciencenew文獻檢索-課件
- (高清版)DZT 0368-2021 巖礦石標(biāo)本物性測量技術(shù)規(guī)程
- 企業(yè)事業(yè)部制的管理與監(jiān)督機制
- 消毒供應(yīng)中心工作總結(jié)
- 研究生導(dǎo)師談心談話記錄內(nèi)容范文
評論
0/150
提交評論