![古騰堡計(jì)劃電子圖書的校對方法_第1頁](http://file4.renrendoc.com/view10/M01/3F/14/wKhkGWWjzWiACQPFAAKNBDhbWSM008.jpg)
![古騰堡計(jì)劃電子圖書的校對方法_第2頁](http://file4.renrendoc.com/view10/M01/3F/14/wKhkGWWjzWiACQPFAAKNBDhbWSM0082.jpg)
![古騰堡計(jì)劃電子圖書的校對方法_第3頁](http://file4.renrendoc.com/view10/M01/3F/14/wKhkGWWjzWiACQPFAAKNBDhbWSM0083.jpg)
![古騰堡計(jì)劃電子圖書的校對方法_第4頁](http://file4.renrendoc.com/view10/M01/3F/14/wKhkGWWjzWiACQPFAAKNBDhbWSM0084.jpg)
![古騰堡計(jì)劃電子圖書的校對方法_第5頁](http://file4.renrendoc.com/view10/M01/3F/14/wKhkGWWjzWiACQPFAAKNBDhbWSM0085.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第第頁古騰堡計(jì)劃電子圖書的校對方法1引言"古騰堡計(jì)劃"是全球最具影響力的免費(fèi)電子書網(wǎng)站之一。它由美國的邁克爾•哈特(MichaelHart)創(chuàng)建于1971年。經(jīng)過多年的發(fā)展,它已擁有超過38000種精校圖書向全球讀者提供免費(fèi)服務(wù),既可以在線閱讀,也可以下載mobi、epub等格式的文件在亞馬遜、蘋果等廠商生產(chǎn)的移動設(shè)備上閱讀。2012年2月,其Alexa全球排名已進(jìn)入前5000位。"古騰堡計(jì)劃"采用了分布式建設(shè)的模式,其圖書大多由來自世界各地的眾多志愿者進(jìn)行加工。由于志愿者在能力、素質(zhì)以及工作熱情等方面存在著諸多差異,為保證古騰堡圖書的質(zhì)量,加強(qiáng)校對的精度顯得日益重要。在這個背景下,2000年,CharlesFranks建立了"分布式校對"系統(tǒng),以支持"古騰堡計(jì)劃"圖書的數(shù)字化文本建設(shè)。最初,這個"分布式校對"系統(tǒng)從屬于"古騰堡計(jì)劃"。2002年,它有了自己的官方網(wǎng)站。2006年,它成為單獨(dú)的法人實(shí)體,但依然與"古騰堡計(jì)劃"有著密切的聯(lián)系,由這個系統(tǒng)產(chǎn)生的電子書,是"古騰堡計(jì)劃"圖書最重要的來源[1]。2"古騰堡計(jì)劃"電子圖書制作流程"古騰堡計(jì)劃"的電子圖書之所以受到廣泛歡迎,是因?yàn)樗仁敲赓M(fèi)的,又是高質(zhì)量的。它的圖書制作遵循著一個非常嚴(yán)格的流程:(1)使用在線的軟件和數(shù)據(jù)庫創(chuàng)建圖書館。(2)世界各地的內(nèi)容提供者將圖書掃描,并將掃描件上傳到圖書館。"古騰堡計(jì)劃"根據(jù)美國版權(quán)法對電子書進(jìn)行版權(quán)驗(yàn)證,只有版權(quán)過期者才可以添加到計(jì)劃的列表中。(3)參與校對的志愿者選擇一本圖書進(jìn)行校對。(4)這時(shí)候,網(wǎng)站會顯示給校對者一個網(wǎng)頁,內(nèi)容包括掃描文件和通過文字識別軟件產(chǎn)生的文本文件,校對者通過兩者的比對進(jìn)行校對。這極大地減少了校對者的工作量。(5)除了修正文字識別軟件所產(chǎn)生的文本中的錯誤,校對者還需標(biāo)注原著中的粗體、斜體字以及腳注等內(nèi)容。(6)校對是協(xié)作式的,來自世界各地的志愿者通過互聯(lián)網(wǎng)可能對同一本書的不同頁進(jìn)行校對。校對者在完成了對某本圖書一頁的校對后,可以再申請新的校對頁,也可以退出校對。有意思的是,"古騰堡計(jì)劃"并不鼓勵校對者一天校對太多的頁數(shù),他們的建議是"一天一頁"。他們認(rèn)為,每個人每天對校對工作貢獻(xiàn)的綿薄之力,最終會形成生產(chǎn)數(shù)字圖書的強(qiáng)大力量。2004年,"古騰堡計(jì)劃"的管理者自豪地宣布:平均每天有300~400個志愿者參與校對工作,平均每天完成校對頁數(shù)4000~7000個,這意味著每分鐘完成校對4個圖書頁。實(shí)際上,2004年以后,志愿者數(shù)量和校對頁數(shù)總量等數(shù)據(jù)每年都有相當(dāng)大的增長[2]。(7)校對過的圖書頁會保存在網(wǎng)站的數(shù)據(jù)庫中,等待下一輪的校對。"古騰堡計(jì)劃"的校對會有2輪,以盡量避免錯誤的發(fā)生。(8)當(dāng)所有的圖書頁都經(jīng)過2輪校對后,"古騰堡計(jì)劃"的處理軟件會將其整合成一本完整的數(shù)字圖書,并且再進(jìn)行一次錯誤檢查。由于一本書的校對很可能是由多人完成,因此這時(shí)的重點(diǎn)在于一致性的檢查上。(9)通過檢查后的圖書會被歸檔,并上傳到全球各地的鏡像站點(diǎn),向全世界提供免費(fèi)閱讀和下載[3]。可以看出,"古騰堡計(jì)劃"的數(shù)字圖書制作,奉行"質(zhì)量優(yōu)先"的原則。雖然它的圖書數(shù)量并不太多,但涵蓋了莎士比亞、列夫•托爾斯泰、馬克•吐溫等著名作家的經(jīng)典作品,另外也包含了許多非文學(xué)類的名家名作,而且這些都是相對可靠的電子文本,為世界各地的讀者進(jìn)行閱讀、欣賞和研究提供了極大的便利。3分布式校對的幾個關(guān)鍵環(huán)節(jié)3.1分布式校對與集中化管理"古騰堡計(jì)劃"的圖書校對和制作雖然是由各地的志愿者采用分布式的方法完成的,但其基礎(chǔ)卻是集中化管理。在版權(quán)認(rèn)定、決定哪些圖書可以進(jìn)行掃描、校對與提交以及圖書的整合、發(fā)布等方面,都不是由志愿者自由和隨意地進(jìn)行,而是由"古騰堡計(jì)劃"的核心小組統(tǒng)一安排。"古騰堡計(jì)劃"的管理者會在廣泛搜羅圖書的基礎(chǔ)上對未加工的圖書進(jìn)行審查和鑒定。作為非贏利性組織,"古騰堡計(jì)劃"準(zhǔn)備加工圖書的來源非常龐雜,很多圖書來自圖書拍賣會、圖書館的剔舊以及各類捐贈。志愿者會將這些圖書的封面、封底和版權(quán)頁掃描,送交"古騰堡計(jì)劃"的版權(quán)小組進(jìn)行審查。版權(quán)小組由熟悉知識產(chǎn)權(quán)領(lǐng)域法規(guī)的專家組成。只有通過審查的圖書,才會被允許進(jìn)行數(shù)字化加工。這一舉措,有效地避免了可能出現(xiàn)的知識產(chǎn)權(quán)糾紛。一旦通過了版權(quán)審查,相應(yīng)的紙質(zhì)圖書會被送交個別志愿者,他們將書脊拆散后掃描,在得到掃描圖像的同時(shí),用文字識別軟件產(chǎn)生與圖像文件對應(yīng)的文本,然后將這些文件上傳到服務(wù)器。這一工作過程也是相對集中的,僅由少數(shù)較為可靠的志愿者完成,這樣可以保證掃描與文字識別的精度。上傳到服務(wù)器的文件進(jìn)入"分布式校對"系統(tǒng),發(fā)布在互聯(lián)網(wǎng)上。這時(shí)來自世界各地的眾多志愿者就可以利用該系統(tǒng)進(jìn)行分布式校對。在所有的工作環(huán)節(jié)中,項(xiàng)目管理員(ProjectManager)、后期制作員(PostProcessor)發(fā)揮著重要作用。項(xiàng)目管理員負(fù)責(zé)監(jiān)控?cái)?shù)字圖書的制作過程,后期制作員負(fù)責(zé)在校對完成后整本圖書的整合工作,包括確定圖書的題名是否正確、圖書結(jié)構(gòu)是否完整、是否有缺頁等[4]。可以看到,"分布式校對"系統(tǒng)的設(shè)計(jì)針對的是在電子書制作中工作量最大的校對環(huán)節(jié),它運(yùn)用Web2.0的思維,利用眾多志愿者的合力突破了圖書數(shù)字化工作中的瓶頸。同時(shí),在電子圖書的制作過程中堅(jiān)持嚴(yán)格的質(zhì)量控制,在目標(biāo)確認(rèn)、工作流程制定、質(zhì)量監(jiān)測、圖書發(fā)布等環(huán)節(jié)均由專家進(jìn)行集中化管理,遵循嚴(yán)謹(jǐn)?shù)囊?guī)范。3.2校次的管理為了防止疏漏和失誤,"古騰堡計(jì)劃"電子圖書的分布式校對并非一次成型,而是堅(jiān)持多次交叉校對。他們把不同階段的校對文本分為"銅文本"(Bronzee-texts)、"銀文本"(Silvere-texts)和"金文本"(Golde-texts),這與中國古代校讎的"三校"制有異曲同工之妙[5]。"銅文本"指那些處于最初校對階段的文本,任何注冊后的志愿者都可以在上面展開工作,主要任務(wù)是清除用軟件進(jìn)行文字識別所產(chǎn)生的錯誤。新加入的志愿者只能從事這一階段的工作,整本圖書的后期加工與合成則由富有經(jīng)驗(yàn)的資深志愿者完成。"銀文本"指那些已經(jīng)經(jīng)過校對并按照規(guī)定的編排格式整合成型、處于后期加工階段的圖書,這一階段的主要任務(wù)是進(jìn)行一系列準(zhǔn)確性和一致性的檢查。"金文本"指那些完成了一系列校對、格式編排、后期加工等程序,提交到古騰堡網(wǎng)站供讀者下載使用的圖書。當(dāng)然,這類圖書的文本也并非不可更改??紤]到數(shù)字圖書生產(chǎn)的復(fù)雜性,各個環(huán)節(jié)的工作稍有疏忽都可能造成錯誤,"古騰堡計(jì)劃"建立起了強(qiáng)大的報(bào)錯機(jī)制。志愿者和普通讀者都可以向古騰堡的管理者報(bào)告其正式發(fā)布的圖書中的錯誤。對于報(bào)錯,"古騰堡計(jì)劃"也有一套自己的流程和標(biāo)準(zhǔn),例如對目錄錯誤和文本錯誤的報(bào)告區(qū)別對待,對如何報(bào)告缺字、排印錯誤等,都有具體的要求[6]。嚴(yán)格的校次管理,保證了數(shù)字圖書的質(zhì)量。強(qiáng)大的報(bào)錯機(jī)制,使得"古騰堡計(jì)劃"的圖書始終處于不斷自我完善的過程之中。#p#分頁標(biāo)題#e#3.3"閱讀校對"環(huán)節(jié)"古騰堡計(jì)劃"的電子圖書制作,有一個"閱讀校對"(smoothreading)的環(huán)節(jié),用來發(fā)現(xiàn)校對容易忽略的錯誤,他們歡迎更多的志愿者作為閱讀者(SmoothReaders)參與到校對工作中來。這與中國古代強(qiáng)調(diào)的讀校法有幾分相似。讀校法是重要的校對方法,對充分調(diào)動各感官的功能,避免生理和心理疲勞,實(shí)現(xiàn)優(yōu)質(zhì)高效的校對目標(biāo),很有作用。當(dāng)然,對于閱讀時(shí)是否必須出聲朗讀,"古騰堡計(jì)劃"并沒有硬性的要求。"古騰堡計(jì)劃"將經(jīng)過對校之后的文本放在一個專門的數(shù)據(jù)庫中,供閱讀校對者使用,每個文本之前都有對這些文本性質(zhì)的描述以及閱讀校對的具體要求,志愿者可以方便地查詢自己感興趣的文本。志愿者下載了文本后,就可以進(jìn)行閱讀。在閱讀過程中,無論是發(fā)現(xiàn)影響流暢表達(dá)還是使自己感覺困惑的段落,志愿者都可以添加標(biāo)注。當(dāng)然,一些明顯的錯誤,志愿者也可以直接進(jìn)行修訂。"古騰堡計(jì)劃"建立了一個機(jī)制,使閱讀者和進(jìn)行圖書的后期加工的志愿者能夠很好地協(xié)同工作。當(dāng)志愿者選擇朗讀某個文本時(shí),可以通過網(wǎng)站發(fā)送信息給從事圖書后期加工的志愿者,讓他知道目前是誰正在對文本進(jìn)行閱讀校對。而閱讀校對的成果,無論是有根據(jù)的改正還是無把握的存疑,又都可以通過網(wǎng)站及時(shí)地反饋給進(jìn)行圖書的后期加工的志愿者[7]。3.4尋求更大的用戶參與度"古騰堡計(jì)劃"電子圖書的生產(chǎn),工作量是巨大的。因此,如何召喚更多的志愿者參與其中,是保證"古騰堡計(jì)劃"活力的關(guān)鍵因素。"古騰堡計(jì)劃"在其網(wǎng)站上專門設(shè)置了"志愿者之聲"的欄目,讓志愿者代表現(xiàn)身說法,解釋他們?yōu)槭裁丛敢饣ㄙM(fèi)那么多業(yè)余時(shí)間進(jìn)行免費(fèi)電子書的制作,從中能夠得到怎樣的樂趣,從志愿工作中如何能夠?qū)ふ业缴膬r(jià)值和意義,從而彰顯網(wǎng)站"創(chuàng)造和分享知識"的核心價(jià)值觀。榜樣的力量是無窮的,"古騰堡計(jì)劃"希望通過這種方式,吸引更多的人參與到網(wǎng)站建設(shè)中來[8]。"古騰堡計(jì)劃"非常重視網(wǎng)上宣傳,尤其重視反向鏈接的數(shù)量。為此,他們專門制作了官方的按鈕和廣告橫幅,植入了網(wǎng)站的鏈接,以HTML代碼形式發(fā)布,鼓勵各類網(wǎng)站和博客插入這些代碼。這些按鈕和廣告橫幅有80x15、104x40、104x90、104x104、468x60等不同像素大小,有的是靜態(tài)的,有的有動畫效果,以適應(yīng)不同網(wǎng)站和博客的不同需求。隨著"古騰堡計(jì)劃"的影響力的不斷增大,其反向鏈接數(shù)量不斷增多,據(jù)Alexa的分析已經(jīng)超過了3.1萬個。眾多的反向鏈接不但為網(wǎng)站帶來了大量的讀者,同時(shí)也帶來了更多的志愿者[9]。此外,F(xiàn)acebook、Google+、Twitter等社交網(wǎng)絡(luò)應(yīng)用也被用于擴(kuò)大網(wǎng)站的影響。"古騰堡計(jì)劃"善于將大的工作任務(wù)分解細(xì)化,以適應(yīng)不同志愿者的能力、素質(zhì)和興趣的差異。除了校對工作外,志愿者還可以承擔(dān)提供紙質(zhì)圖書、燒制電子書光碟供沒有互聯(lián)網(wǎng)接入地區(qū)的人們使用、在網(wǎng)絡(luò)上宣傳等不同性質(zhì)的任務(wù)。讓人們做自己擅長和感興趣的事,這種理念也有助于志愿者數(shù)量的增長,有利于用戶參與度的提高[10]。3.5詳盡的幫助文檔和協(xié)作者社區(qū)的建立由于參與電子書制作的志愿者是一個非常龐大的群體,為有效地協(xié)同工作,"古騰堡計(jì)劃"提供了非常詳細(xì)的幫助文檔,建立了一個FAQ中心,內(nèi)容包括入門性質(zhì)的概況介紹、分布式校對、格式編排、圖書后期加工、項(xiàng)目的創(chuàng)建和管理、如何指導(dǎo)新手、建議、報(bào)錯與開發(fā)、郵件列表等諸多方面。以分布式校對為例,幫助文檔內(nèi)容涵蓋校對的指導(dǎo)方針、摘要、細(xì)則、為新手準(zhǔn)備的教程與測試以及校對軟件的使用指南。標(biāo)準(zhǔn)版和加強(qiáng)版軟件的使用指南分別列出,以方便志愿者的查詢[11]。"古騰堡計(jì)劃"為參與分布式校對的志愿者提供了一個BBS論壇,為大家的交流提供了一個網(wǎng)絡(luò)平臺。論壇分為新手入門、站務(wù)、活動、項(xiàng)目、社區(qū)、軟件使用、基金會等子版塊。如果志愿者在校對過程中遇到疑問,在幫助文檔中又無法找到,可以在論壇中發(fā)表論題,尋求幫助,展開討論。論壇的活躍程度較高,共擁有超過10萬的注冊用戶,發(fā)表了超過70萬的論題。協(xié)作者社區(qū)不但是志愿者答疑解惑的平臺,也是志愿者凝聚力的重要保證[12]。4古騰堡模式的借鑒意義實(shí)踐證明,由眾多用戶參與內(nèi)容建設(shè)的Web2.0方式,比閉門造車要有效率得多。目前國內(nèi)有許多失去著作財(cái)產(chǎn)權(quán)保護(hù)時(shí)間限制的圖書,包括大量有價(jià)值的古籍,并沒有進(jìn)行數(shù)字化加工。許多圖書館和其他機(jī)構(gòu)想要進(jìn)行這一工作,因?yàn)辇嫶蟮墓ぷ髁坑譀]有充足的經(jīng)費(fèi)和人員支持從而裹足不前。如果我們能夠參照"古騰堡計(jì)劃"分布式校對的工作模式,動員大批志愿者參加圖書數(shù)字化工作,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 未來十年移動支付的科技發(fā)展趨勢預(yù)測
- 標(biāo)準(zhǔn)化管理在生產(chǎn)現(xiàn)場的挑戰(zhàn)與對策
- 現(xiàn)代音樂文化的全球化傳播路徑
- 13人物描寫一組(說課稿)2023-2024學(xué)年統(tǒng)編版語文五年級下冊
- Unit 1 Playtime Lesson 3(說課稿)-2023-2024學(xué)年人教新起點(diǎn)版英語二年級下冊001
- 25 少年閏土 第二課時(shí) 說課稿-2024-2025學(xué)年語文六年級上冊 統(tǒng)編版
- Unit1 London is a big city(說課稿)2023-2024學(xué)年外研版(三起)四年級下冊
- 2024-2025學(xué)年高中生物 第七章 現(xiàn)代生物進(jìn)化理論 第1節(jié) 現(xiàn)代生物進(jìn)化理論的由來說課稿3 新人教版必修2
- Unit 2 Being a good language learner Exploring and Using 說課稿-2024-2025學(xué)年高中英語重大版(2019)必修第一冊
- 2025挖掘機(jī)勞動合同范文
- 北師大版五年級上冊四則混合運(yùn)算100道及答案
- 專項(xiàng)債券在燃?xì)饣A(chǔ)設(shè)施建設(shè)中的融資作用
- 人教部編版道德與法治八年級下冊:6.3 《國家行政機(jī)關(guān)》說課稿1
- GE-LM2500+G4航改燃?xì)廨啓C(jī)在艦船和工業(yè)上的應(yīng)用
- 2024山東能源集團(tuán)中級人才庫選拔(高頻重點(diǎn)提升專題訓(xùn)練)共500題附帶答案詳解
- 鋼鐵是怎樣煉成的讀后感作文700字
- 武漢市江夏區(qū)2022-2023學(xué)年七年級上學(xué)期期末數(shù)學(xué)試卷【帶答案】-109
- 學(xué)校物業(yè)服務(wù)合同范本專業(yè)版
- SL 288-2014 水利工程施工監(jiān)理規(guī)范
- 部編版八年級語文上冊期末考試卷
- 2024年02月中央軍委后勤保障部2024年公開招考專業(yè)技能崗位文職人員筆試參考題庫附帶答案詳解
評論
0/150
提交評論