




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
面向生成式Al的向量數(shù)據(jù)庫:架構(gòu),性能與未來趨勢高超/Zilliz工程師高超D向量數(shù)據(jù)庫背景介紹D性能的關(guān)鍵-索引向量數(shù)據(jù)庫背景介紹zilliz樣的Metric,常見的有L2,IP米zilliz·向量數(shù)據(jù)庫是一種專為存儲(chǔ)和查詢高維度向量數(shù)據(jù)而優(yōu)化的數(shù)據(jù)庫系統(tǒng)Vector已經(jīng)被廣泛應(yīng)用于機(jī)器學(xué)習(xí)應(yīng)用中,包括推薦系統(tǒng),搜索,風(fēng)控,安防等系統(tǒng)中?,F(xiàn)在仍然是重要的使用場景搞笑美女網(wǎng)頁新同首頁圖說新聞搞笑美女網(wǎng)頁新同首頁圖說新聞該圖片可能是:榴蓮酥該圖片可能是:榴蓮酥相似圖片Generation(RAG),VectorVector米zilliz什么是一個(gè)好的向量數(shù)據(jù)庫·可觀測可運(yùn)維·加載和查詢4·Index:索引構(gòu)建爭搶查詢資源LogBroker目目目▲▲▲▲實(shí)時(shí)性和性能的tradeoff·Segment是milvus查詢的最小單位詢,保證數(shù)據(jù)的實(shí)時(shí)可見,性能差queryNode上的數(shù)據(jù)加速查詢segment,加速查詢向量檢索更加友好件,跳過消息隊(duì)列,直接插入到對象存儲(chǔ)全局索引向量數(shù)據(jù)庫即服務(wù)多實(shí)例架多實(shí)例架訪問控制多AZ高可用監(jiān)控告警審計(jì)全商業(yè)版商業(yè)版理鑒權(quán)BYOC三個(gè)版本,面向不同需鑒權(quán)網(wǎng)絡(luò)控制網(wǎng)絡(luò)控制Azure,阿里云、騰訊云等主流向量索引●樹索引:維度災(zāi)難,性能差·量化:精度有限,但比哈希更為常用·圖索引:占用資源高,精度和性能優(yōu)異樹哈希量化圖·Knowhere作為milvus的核心向量引擎,集成了多種向量算法,供用戶自由選擇·對外統(tǒng)一接口,方便集成新索引米zilliz·暴搜:效率很低,但100%準(zhǔn)確!●數(shù)據(jù)量少的時(shí)候可能優(yōu)于索引的性能·對數(shù)據(jù)點(diǎn)做聚類,分成若干個(gè)buckets,避免搜索全量數(shù)據(jù)量通過聚類編碼成聚類中心id,有效壓縮向量的內(nèi)存占用·查詢時(shí)預(yù)計(jì)算query向量和每段聚類中心的距離,把距離計(jì)算轉(zhuǎn)化成查表操作y?Y?y?Y?y4y?y?y7y?·建索引的原則:近鄰的近鄰大概率是近鄰,同時(shí)引入一些長邊防止陷入局部最優(yōu)索找到最終結(jié)果NeighborsVec2Neig計(jì)算精確距離,同時(shí)得到鄰居id,用到內(nèi)存中的PQ編碼計(jì)算近似距離用于導(dǎo)航·DiskANN可以實(shí)現(xiàn)較低的內(nèi)存占用,達(dá)到還不錯(cuò)的性能和高精度集成到knowhere,充分利用gpu的并行計(jì)算能力,加速索引構(gòu)建和查詢Milvus-CAGRAvsMilvus-HNSWMilvus-CAGRAvsMilvus-HNSW500K1536-dimT4A10GT4:16.8xA10G:25.8xT4:6.7xA10G:9x如何選擇最合適的索引量化的方案?!はM岣遖ccuracy則不去做激進(jìn)的量化策略,要求很高則使用FLAT。索引/gpu索引方案Zillizcloud商業(yè)版索引引擎-cardinal成為一個(gè)基本需求標(biāo)量過濾的效率。同時(shí)支持向量側(cè)通過標(biāo)量分布構(gòu)建融合索引加速過濾774a63r33s42e640700006076304004300004200000000032dense=[0.2,0.3,0.5,0.7,...]#severalhundredfloatsMRR@10R@1000NDCG@10R@1000--檢索,可以是多個(gè)densevector,也可以是denseVectors_t→→Input:Multi-VectorsDataset:Multi-fields78.480.056.955.557.778.657.859.356.072.869.970.178.686.67.168.743.738.845.265.335.548.248.956.361.544.557.979.070.79.681.159.457.258.880.159.061.458.274.571.271.279.087.79.680.758.857.559.279.757.662.858.373.971.369.878.5的需求。在文本檢索時(shí),一個(gè)向量代表一個(gè)chunk,缺少全文視角Exam
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 浙江省紹興市柯橋區(qū)2025年高三第二次教學(xué)質(zhì)量監(jiān)測數(shù)學(xué)試題含解析
- 內(nèi)蒙古自治區(qū)巴彥淖爾市2024-2025學(xué)年高三下學(xué)期入學(xué)摸底測試歷史試題含解析
- 2025陜西電子信息集團(tuán)光電科技有限公司招聘筆試參考題庫附帶答案詳解
- 2025陜西阿康紫陽縣農(nóng)村供水管理有限公司招聘21人筆試參考題庫附帶答案詳解
- 2025福建南平武夷新區(qū)城市服務(wù)有限公司招聘7人筆試參考題庫附帶答案詳解
- 2025晶益通(四川)半導(dǎo)體科技有限公司招聘166人筆試參考題庫附帶答案詳解
- 2025年黃山徽州浪漫紅文旅集團(tuán)有限公司招聘20人筆試參考題庫附帶答案詳解
- 自貢市市屬事業(yè)單位聘用教師考試真題2024
- 山東嵐山區(qū)人民法院招聘筆試真題2024
- 普洱市檢驗(yàn)檢測院招聘筆試真題2024
- GB/T 16895.36-2024低壓電氣裝置第 7-722 部分:特殊裝置或場所的要求電動(dòng)車供電
- 人音版初中音樂 九年級上冊 中考一輪復(fù)習(xí)課件
- ISO9001-ISO14001-OHSAS18001三合一體系程序文件
- 保險(xiǎn) 早會(huì)主持人培訓(xùn)
- 城市道路平面設(shè)計(jì)規(guī)范標(biāo)準(zhǔn)
- Q∕GDW 12164-2021 變電站遠(yuǎn)程智能巡視系統(tǒng)技術(shù)規(guī)范
- 草莓栽培技術(shù)(課堂PPT)課件
- 機(jī)耕橋施工方案
- 貨車掛靠協(xié)議完整
- 教學(xué)能力大賽三相異步電動(dòng)機(jī)的基本控制+教案
- 鋼格構(gòu)柱組合式塔吊方案(專家認(rèn)證)
評論
0/150
提交評論