深度學(xué)習(xí)與計(jì)算機(jī)視覺實(shí)戰(zhàn)-習(xí)題數(shù)據(jù)和答案_第1頁(yè)
深度學(xué)習(xí)與計(jì)算機(jī)視覺實(shí)戰(zhàn)-習(xí)題數(shù)據(jù)和答案_第2頁(yè)
深度學(xué)習(xí)與計(jì)算機(jī)視覺實(shí)戰(zhàn)-習(xí)題數(shù)據(jù)和答案_第3頁(yè)
深度學(xué)習(xí)與計(jì)算機(jī)視覺實(shí)戰(zhàn)-習(xí)題數(shù)據(jù)和答案_第4頁(yè)
深度學(xué)習(xí)與計(jì)算機(jī)視覺實(shí)戰(zhàn)-習(xí)題數(shù)據(jù)和答案_第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

深度學(xué)習(xí)與計(jì)算機(jī)視覺實(shí)戰(zhàn)-習(xí)題數(shù)據(jù)和答案

第一章

一、選擇題

1、ABC

2、ACD

3、AB

4、ABD

5、ABCD

6、C

二、填空題

1、圖像增強(qiáng)、圖像恢復(fù)、圖像壓縮

2、圖像處理、模式識(shí)別

3、特征能力強(qiáng)、識(shí)別精度高、魯棒性好

4、Keras

三、簡(jiǎn)答題

1、計(jì)算機(jī)視覺研究的目標(biāo)是賦予機(jī)器自然視覺的能力。

2、在分布式訓(xùn)練中,TensorFlow和PyTorch的一個(gè)主要差異特點(diǎn)是數(shù)

據(jù)并行化,用TensorFlow時(shí),使用者必須手動(dòng)編寫代碼,并微調(diào)要在

特定設(shè)備上運(yùn)行的每個(gè)操作,以實(shí)現(xiàn)分布式訓(xùn)練;而PyTorch則是利

用異步執(zhí)行的本地支持來實(shí)現(xiàn)的,其自身在分布式訓(xùn)練是比較欠缺的。

在可視化方面,TensorFlow內(nèi)置的TensorBoard庫(kù)非常強(qiáng)大,能夠顯

示模型圖,繪制標(biāo)量變量,實(shí)現(xiàn)圖像、嵌入可視化,甚至是播放音頻

等功能;反觀PyTorch的可視化情況,則顯得有點(diǎn)差強(qiáng)人意,開發(fā)者

可以使用Visdom,但是Visdom提供的功能很簡(jiǎn)單且有限,可視化效

果遠(yuǎn)遠(yuǎn)比不上TensorBoardo

在生產(chǎn)部署方面,TensorFlow可以直接通過TensorFlowServing部署

模型,而PyTorch沒有提供任何用于在網(wǎng)絡(luò)上直接部署模型的框架,

需要使用Flask或者另一種替代方法來基于模型編寫一個(gè)APL

第二章

一、選擇題

1、C

2、B

3、B

4、C

5、AC

6、C

7、D

8、B

9、CD

10、BC

二、填空題

1、高頻信息、低頻信息

2、幾何

3、椒鹽

4、色調(diào)、飽和度、亮度

第三章

一、選擇題

1、A

2、B

3、B

4、A

5、A

6、BC

7、BCD

8、D

9、C

10、ACD

二、填空題

1、旋轉(zhuǎn)、平移、縮放

2、平均池化、最大池化

3、RPN

4、卷積、轉(zhuǎn)置卷積

5、生成器網(wǎng)絡(luò)、判別器網(wǎng)絡(luò)

第四章

一、選擇題

1、ABD

2、A

3、B

4、AD

5、ACD

6、D

7、AB

8、AC

9、AB

10、C

二、填空題

1、知識(shí)規(guī)則、模板匹配、統(tǒng)計(jì)模型

2、梯度方向直方圖、局部二值模式

3、P-Net>R-Net、O-Net

4、人臉檢測(cè)、人臉對(duì)齊、人臉特征提取、特征匹配

5、高聚合性、低耦合性

三、簡(jiǎn)答題

1、P-Net的作用是快速排除圖像中不含人臉的部分;R-Net的作用是

進(jìn)一步排除不含人臉的部分,并估計(jì)人臉框的位置;O-Net的作用是

確定人臉的位置,重疊的候選框用NMS除去,并且最終標(biāo)記人臉的

眼睛、鼻尖、嘴角共5個(gè)位置。

2、原因:自然場(chǎng)景下得到的人臉框不一定是正臉狀態(tài),人臉角度的

偏移容易導(dǎo)致人臉識(shí)別出錯(cuò),因此在進(jìn)行人臉識(shí)別之前需要進(jìn)行人臉

對(duì)齊操作。

方法:利用MTCNN輸出的5個(gè)人臉關(guān)鍵點(diǎn)的精準(zhǔn)坐標(biāo),使用簡(jiǎn)單的

仿射變換方法將人臉旋轉(zhuǎn)一定角度。

3、人臉特征匹配實(shí)際上就是計(jì)算人臉識(shí)別圖像的特征向量與人臉圖

像特征庫(kù)中每個(gè)特征向量的距離,通常采用歐氏距離或余弦距離計(jì)算,

兩者距離越近表明兩個(gè)人臉特征屬于同一個(gè)人的可能性越大。

第五章

一、選擇題

1、ACD

2、AB

3、D

4、B

5、ABCD

6、BD

7、C

8、ABD

9、AB

10、C

二、填空題

1、特征提取、RPN網(wǎng)絡(luò)、邊界框分類回歸網(wǎng)絡(luò)

2、篩選出待識(shí)別的目標(biāo)區(qū)域、進(jìn)行再次分類和回歸

3、偏移

4、TP/(TP+FP)

5、侯選框、先驗(yàn)錨框、真知邊界框

三、簡(jiǎn)答題

1、目標(biāo)檢測(cè)算法通常會(huì)在輸入圖像中使用預(yù)設(shè)邊框采樣大量的區(qū)域,

然后判斷區(qū)域中是否包含需要檢測(cè)的目標(biāo),在FasterR-CNN中,以每

個(gè)像素為中心生成多個(gè)大小和寬高比不同的預(yù)設(shè)邊框,這些預(yù)設(shè)邊框

即先驗(yàn)錨框。

2、RPN的目的是區(qū)分一張圖像的前景和背景,即區(qū)分先驗(yàn)框中的內(nèi)

容是目標(biāo)還是背景,目標(biāo)的標(biāo)簽為1,背景的標(biāo)簽為0,是一個(gè)二分

類的任務(wù),因此使用的是二分類損失。

3、ROIPooling是針對(duì)R0I的Pooling層,R0I在FasterRCNN中指的是

RPN的輸出,是一堆矩形候選框。先把R0I中的坐標(biāo)映射到featuremap

上,得到了featuremap上的box坐標(biāo)后,使用Pooling得到尺寸固定

的輸出。

第六章

一、選擇題

1、ABCD

2、C

3、AC

4、D

5、C

6、D

7、C

8、C

9、B

10、AC

二、填空題

1、編碼層和解碼層、編碼層、解碼層

2、FCN、數(shù)據(jù)增強(qiáng)

3、堆疊、融合

4、不平衡、小目標(biāo)

三、簡(jiǎn)答題

1、因?yàn)檎Z(yǔ)義分割是對(duì)圖像中所有像素進(jìn)行分類,使用Sigmoid函數(shù)

可以得到像素值所屬類別的概率,從而確定類別。

2、從DiceLoss的計(jì)算公式中可以看出,該損失是一個(gè)區(qū)域相關(guān)的損

失,區(qū)域相關(guān)的意思就是,當(dāng)前像素的loss不光和當(dāng)前像素的預(yù)測(cè)值

相關(guān),和其他點(diǎn)的值也相關(guān)。DiceLoss的求交的形式可以理解為mask

掩碼操作,因此不管圖片有多大,固定大小的正樣本的區(qū)域計(jì)算的loss

是一樣的,對(duì)網(wǎng)絡(luò)起到的監(jiān)督貢獻(xiàn)不會(huì)隨著圖片的大小而變化。

3、在圖像領(lǐng)域,語(yǔ)義指的是圖像的內(nèi)容,對(duì)圖片意思的理解,例如

城市道路圖像中的行人、建筑、汽車等;分割的意思是從像素的角度

分割出圖片中的不同對(duì)象,對(duì)原圖中的每個(gè)像素都進(jìn)行標(biāo)記。

第七章

一、選擇題

1、ACD

2、AB

3、B

4、BC

5、A

6、AD

7、C

8、D

9、B

10、D

二、填空題

1、越高、豐富

2、模糊、失真

3、低分率圖像、生成器模型

4、BCE/二元交叉增、反欺詐

5、判別器損失/d」oss、判別器識(shí)別正確率/d_acc、生成器對(duì)抗損失

/g_loss>生成器特征損失/feature_los

三、簡(jiǎn)答題

1、隨著判別器鑒別能力逐漸增強(qiáng),生成器產(chǎn)生的損失增大,使得生

成器需要生成更真實(shí)的高分辨率圖像,令判別器難以判斷圖像是否為

真實(shí)圖像。隨著生成器生成的圖像質(zhì)量逐漸提高,反過來導(dǎo)致判別器

的損失增大,使得判別器需要增強(qiáng)鑒別能力,令生成器生成的圖像能

夠更準(zhǔn)確地被檢測(cè)出。

迭代直至判別器無法分辨輸入的圖像是由生成器生成還是真實(shí)的圖

像,則認(rèn)為兩者達(dá)到了納什均衡,即任何一方的改進(jìn)都不會(huì)導(dǎo)致總體

的收益增加。

2、內(nèi)容損失由真實(shí)高分辨率圖像

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論