CAJ、KDH文件怎樣轉(zhuǎn)換成WORD格式.doc_第1頁(yè)
CAJ、KDH文件怎樣轉(zhuǎn)換成WORD格式.doc_第2頁(yè)
CAJ、KDH文件怎樣轉(zhuǎn)換成WORD格式.doc_第3頁(yè)
CAJ、KDH文件怎樣轉(zhuǎn)換成WORD格式.doc_第4頁(yè)
CAJ、KDH文件怎樣轉(zhuǎn)換成WORD格式.doc_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

CAJ、KDH、NH文件怎樣轉(zhuǎn)換成WORD格式 最近更新: 2011-05-06 14:43 瀏覽次數(shù): 61673 次 收藏次數(shù): 5 次 舉報(bào) 作者聲明:本篇經(jīng)驗(yàn)系本人依照真實(shí)經(jīng)歷原創(chuàng),未經(jīng)許可,謝絕轉(zhuǎn)載。 CAJ、KDH、NH文件格式是我們檢索一些論文或者期刊經(jīng)常會(huì)遇到的格式(中國(guó)知網(wǎng)上的文件資料基本上都是這些格式的)。有時(shí)候我們需要摘錄其中一些內(nèi)容,但是這些格式的文件內(nèi)容是不能夠被復(fù)制的,那么我們就需要將這些格式的文件轉(zhuǎn)換成WORD格式。工具/原料 CAJViewer 7完整版 (帶OCR組件) PDF虛擬打印機(jī)(本文以PDF factory 為例) OCR識(shí)別軟件 (本文以ABBYY finereader 9為例) 步驟/方法1. 用CAJviewer 7打開(kāi)你要轉(zhuǎn)換的文件,如下圖所示 如果我們需要第一段的內(nèi)容,那么我們需要點(diǎn)擊CAJViewer 7自帶的OCR功能鍵,如下圖圖中紅色方框框出的按鈕就是OCR識(shí)別按鈕(如果你使用的是精簡(jiǎn)版的CAJviewer,那么這個(gè)按鈕是灰色的,不可用的),我們點(diǎn)擊一下鼠標(biāo)就會(huì)變成十字形,然后我們?cè)诋?dāng)前頁(yè)面上框選出需要的內(nèi)容,稍等一會(huì)兒就會(huì)彈出一個(gè)識(shí)別文字的方框,我們可以選擇復(fù)制到剪貼板或者發(fā)送到word,然后關(guān)閉這個(gè)識(shí)別框就可以了。(OCR識(shí)別是有錯(cuò)誤率的,所以識(shí)別后我們需要人工校對(duì))如果我們只需要摘錄一小部分內(nèi)容的話,那么我們用這個(gè)方法就可以了,如果想整篇文章都轉(zhuǎn)換成可以編輯的word格式的話,那么我們繼續(xù)往下看。 2. 這一步我們的思路是將CAJ、KDH、NH文件轉(zhuǎn)換成PDF,然后再將PDF轉(zhuǎn)換成WORD格式的方法來(lái)轉(zhuǎn)換。那么我們需要現(xiàn)將這樣的文件轉(zhuǎn)成PDF格式。推薦使用PDF虛擬打印機(jī),本文以PDF factory 為例。(PDF Craetor或者foxit 系列軟件的PDF虛擬打印機(jī)可能和CAJviewer 有沖突,轉(zhuǎn)換出來(lái)的PDF只有上半頁(yè)面,下半個(gè)頁(yè)面是空白的,所以我這里不推薦大家使用)CAJviewer 軟件菜單 文件-打印-彈出打印界面如上設(shè)置 ,如果你用的是其他的PDF虛擬打印機(jī),選擇相應(yīng)的打印機(jī)即可,其他基本上默認(rèn)就可以,點(diǎn)擊確定,等待轉(zhuǎn)換,然后保存為PDF文件。 3. 接下來(lái)我們的任務(wù)就是把轉(zhuǎn)換好的PDF文件轉(zhuǎn)成WORD,那么這里我們使用ABBYY finereader這款強(qiáng)大的PDF轉(zhuǎn)換軟件來(lái)進(jìn)行OCR轉(zhuǎn)換。(因?yàn)閺腃AJviewer轉(zhuǎn)換過(guò)來(lái)的PDF文件是圖片形式的PDF文件,所以用其他的PDF轉(zhuǎn)word軟件是無(wú)能為力的,必須要帶有OCR功能的轉(zhuǎn)換軟件才可以,這點(diǎn)請(qǐng)大家務(wù)必記住。)我們運(yùn)行ABBYY finereader軟件,設(shè)置好識(shí)別文件的語(yǔ)言種類(可以是多種的)如果不想軟件打開(kāi)是顯示該頁(yè)面,可以勾選“不在顯示此窗口”選項(xiàng),打開(kāi)剛才保存的PDF文件,文件自動(dòng)進(jìn)行OCR識(shí)別。如下圖: 識(shí)別過(guò)程中如果有無(wú)法識(shí)別部分或者錯(cuò)誤,軟件會(huì)有警告提示的。識(shí)別完畢后,軟件菜單文件-另存為-Microsoft word文檔 保存即可,如下圖:1. 保存以后的WORD文件我們用軟件打開(kāi)看一下,轉(zhuǎn)換效果如下圖所示:轉(zhuǎn)換的效果基本上還是可以的,版面的還原能力也不錯(cuò),剩下的事情就是自己要和原文校核一下,大功告成。 總結(jié):鑒于最近收到大量的要求幫助轉(zhuǎn)換文件的郵件,所以決定寫(xiě)出此篇經(jīng)驗(yàn)供大家參考,畢竟我一個(gè)人的力量是有限的。希望這篇經(jīng)驗(yàn)?zāi)軌驇椭蠹医鉀Q問(wèn)題注意事項(xiàng) 文件最后的轉(zhuǎn)換效果和你所用的PDF虛擬打印機(jī)的轉(zhuǎn)換效果有直接的關(guān)系,轉(zhuǎn)換成的PDF文件清晰度越高,最后OCR識(shí)別的準(zhǔn)確率越高。 如果你的文件中間包含有大量的數(shù)學(xué)公式、物理公式、三角函數(shù)、各種計(jì)算式目前還不能夠被識(shí)別,所以這些都需要我們自己用公式編輯器手動(dòng)輸入,這個(gè)也是目前最遺憾的事情了。 參考資料1.

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論