




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
2017賽變成了一個類似于ImageNet一樣大家可以刷榜的競賽,所有的人都在爭取第一,但這也同時變相的促進了技術(shù)的進步;最早MSA周銘老師的隊伍,后來科大訊飛和哈工大的老師一起做,成績也都不錯;SQuAD1.0的時候榜單上最好的成績是83%左右,但是后來斯關(guān)注Google出了個模型叫做Bert,我們內(nèi)部笑稱它是大力出奇跡,它的具體原理很簡單就是找一個model能夠融合我所有的數(shù)據(jù),然后不管讓它自己訓(xùn)練去,Google資金充足算力強,需要等兩周,但對于我們普通公司來說,會等待更長的時間。NLP是一件比較綜合的事情,做好還是比較難的,我們這一行有兩個不太好的狀況我們現(xiàn)在拿到的GPU最早是給Image設(shè)計的,都是四四方方的,它對圖像處理是得天獨厚的NVDIA對圖像的處理20NLPDNNImage我們語言不是一個規(guī)則的東西,做結(jié)構(gòu)化分析和鏈?zhǔn)椒治龆疾皇呛芎米?,這些事情在GPU上運行是非常非常難受的,需要做很多額外的預(yù)處理操作;回到Bert,它真的是大力出奇問答系統(tǒng)在自然語言處理里其實已經(jīng)有很多很多年了,他是一個NLP的標(biāo)桿性應(yīng)用,我們學(xué)生們的理解水平;現(xiàn)在問答在NLP里面有很多作為核心技術(shù)的應(yīng)用,比如說智能客服和siri圖1實用問答系統(tǒng)的舉例WolframAlpha圖2問題“明天需要帶傘嗎?”然后Bingbot,比較傳統(tǒng)的結(jié)構(gòu)它是一個模塊化的系統(tǒng),第一步,有了用戶的query以后,我們并行計算querygoogledocs,然后我們在其中根據(jù)query匹配答案;閱讀理解跟基于搜索的問答非常像,只不過這個問答不用你圖3基于搜索的自動問答圖4接下來是端到端閱讀理解,閱讀理解數(shù)據(jù)集sQuAD我之前已經(jīng)講過,它是以Wikipedia(span)。還有一個不太有名的比較復(fù)雜的數(shù)據(jù)集是MSMARCO,它的問題來自搜索引span,還需要做一些提取和綜合答案,因為比較復(fù)雜,所以做圖5詞Focuswords,焦點詞分為顯性和隱性兩種,它聲明了答案的類型;第二步驟是在文章預(yù)期答案類型,同樣的問答類型的識別可以用粗顆粒答案類型和直接使用query中的焦點圖6模型整體結(jié)構(gòu)示意圖成四塊:最底層是Representation(特征表示層),作用是看這個詞在這個場景中是什么答案,我們要在model中把問題的信息通過這個機制對每一個字進行重新表示,利用注意力機制融合問題和篇章信息,我們用的模型是Match-LSTM、BiDAF和DCA等;最后我spanSpan應(yīng)的細節(jié)大家可以再paper上面找,我這里就不詳細講了。如果大家想做這個方面的問答AI真正的落地。對話的用戶體驗是一個更自然的體驗,我對和個對話用戶體驗很認(rèn)同。因為對任何人來說最重要的事情就是時間;因為這個時間都是24小時,時間過去了再也不會學(xué)習(xí)App如何使用其實是我們并不關(guān)心的。我們年輕人來說還好,但是對于我們的父母和吃,我們并不關(guān)心App是在哪里?怎么用?如何選取優(yōu)惠現(xiàn)在慢慢的大家都開始關(guān)注小程popularApp吸引力了,有了小程序,可以慢
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年金屬氫化物-鎳(MHNI)蓄電池合作協(xié)議書
- 2025至2030年中國德式木工鑿數(shù)據(jù)監(jiān)測研究報告
- 二零二五年度企業(yè)保險合作協(xié)議及風(fēng)險評估
- 2025年度藝術(shù)家與藝術(shù)策展人合作策展協(xié)議
- 2025年度租賃合同糾紛調(diào)解與執(zhí)行中介服務(wù)協(xié)議
- 二零二五年度個人出差住房租賃及旅游咨詢服務(wù)協(xié)議
- 二零二五年度綠色金融基金份額代持與可持續(xù)發(fā)展協(xié)議
- 2025年度校企合作實習(xí)基地共建協(xié)議(智能制造)
- 二零二五年度土地征用賠償及農(nóng)民權(quán)益保障合同
- 二零二五年度公租房購房擔(dān)保合同
- 煤礦提升機作業(yè)理論考試參考題庫(200題)
- 新人教版七至九年級英語單詞表 漢譯英(含音標(biāo))
- 侯馬北車輛段2023年運用機考復(fù)習(xí)題-曲沃作業(yè)場
- 手術(shù)室停電和突然停電應(yīng)急預(yù)案PPT演示課件
- 職業(yè)病危害告知卡(油漆)
- 抗震支吊架安裝檢驗批
- 橋梁各部位加固及橋梁維修技術(shù)總結(jié)
- GB/T 40336-2021無損檢測泄漏檢測氣體參考漏孔的校準(zhǔn)
- 馬工程教材《公共財政概論》PPT-第十一章 政府預(yù)算
- FZ/T 01085-2009熱熔粘合襯剝離強力試驗方法
- 麻風(fēng)病科普知識培訓(xùn)課件
評論
0/150
提交評論