(央視,百家講壇)數(shù)字時代用戶界面_第1頁
(央視,百家講壇)數(shù)字時代用戶界面_第2頁
(央視,百家講壇)數(shù)字時代用戶界面_第3頁
(央視,百家講壇)數(shù)字時代用戶界面_第4頁
(央視,百家講壇)數(shù)字時代用戶界面_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、數(shù)字時代用戶界面-李開復主講人簡介李開復,美國微軟公司副總裁,是語音識別技術方面的專家。1961年出生于中國臺灣,1972年隨母親遷往美國。畢業(yè)于哥倫比亞大學,后畢業(yè)于全球最有名的計算機研究大學卡內(nèi)基梅隆大學,獲得博士學位。80年代末加盟蘋果公司,曾連續(xù)三年得到權(quán)威刊物的最佳科技獎。1997年擔任微軟亞洲研究院院長。2000年調(diào)入微軟總部擔任副總裁。內(nèi)容簡介從1985年,PC的應用是從DOS到Windows。在以后的十年之內(nèi),有了Windows,有了Internet的發(fā)展,帶來了多視窗的、鏈接的圖形功能,這些就是在用戶界面上的一大革命?,F(xiàn)在我們用的圖形用戶界面就是所見即所得,看到它就能用它,是

2、靠鼠標等基礎之上做的用戶界面??墒钱斘覀冞M入了網(wǎng)絡時代,應用軟件就會有越來越豐富的內(nèi)容。隨著我們工作的增多,放在屏幕上,讓我們看到所有可以做的功能,已經(jīng)不適應如今高節(jié)奏的工作狀況,這個時候所見即所得的圖形用戶界面就會碰到一個瓶頸,而依靠語音技術的發(fā)展產(chǎn)生的自然用戶界面將幫助我們解決這一難題。將來,我們的電腦不僅僅是一個工具,而是一個得力的助手,你可以和你的手中的電腦講話,而電腦也會理解你的意圖幫你完成各項工作。語音可以說是惟一共通的表達的方法,無論你有沒有鼠標,有沒有鍵盤,只要有語音就可以。未來的用戶界面究竟將會怎樣?敬請關注由語音技術為您全新打造的數(shù)字時代的用戶界面。全文謝謝各位同學大家好!

3、回到北京真振奮,尤其看到這么多中國的年輕朋友。今天我很高興有機會來介紹一下在 Digital Decade(數(shù)字十年) ,在用戶界面上會有一些什么樣的機會?我們都知道,從1985年PC的開始,它的用戶界面是一個很簡單的 Dos Command Interface(Dos 命令用戶界面),我們要靠人去強迫地記得怎么和計算機來做一個溝通。那么在后來的十年之內(nèi)有了Windows、有了Internet的發(fā)展,帶來了Menus(菜單) ,多視窗的Internet帶來了 Hyperlink(超鏈接) 鏈接的圖形的功能,這些就是所謂的圖形用戶界面。這是在用戶界面方面的一大革命,圖形用戶界面就是所見及所得,W

4、hat you see is what you get,它是靠了BitmapDisplay(位圖顯示),靠了鼠標,靠了Internet的一些標準,在這基礎之上做的用戶界面。它的原理就是,我們能用眼睛看到的一些用戶界面的 Element(內(nèi)容),我們看到了它,我們就能夠去用它,我用了它就會執(zhí)行工作,這樣一個理念之下,它是非常好用的。因為對于人們來說我能看見我就能用它是非常直觀的,尤其是一些很常用到的功能。比如說Windows 的Tool Bar(Windows工具欄),我常常用它,它就老在我的機器上出現(xiàn),我就可以直接地去使用它,所以這是它的好處。所以Frequent action 常用的動作在圖

5、形用戶界面特別好用,因為它就在你面前,你一按事情就發(fā)生了。但是當我們進入網(wǎng)絡時代,進入Web Service(Web服務)時代,未來的應用軟件會有更豐富的內(nèi)容,這個時候所見即所得就不夠好了。因為我們能做的功能太多了,不是一個可以放在屏幕上,讓我們可以看到所有可以做的功能,所以這個時候圖形用戶界面就會碰到一個瓶頸。我們繼續(xù)往后發(fā)展,未來的Digital Decade(數(shù)字十年),有三個很大的趨勢:第一個是XML帶來的一種格式,第二個是Web Service(Web服務),讓我們能夠把整個Internet當做一個操作計算的環(huán)境,讓我們編程能夠從手表一直到服務器上都可以使用,第三是Smart dev

6、ices(智能設備),很聰明的設備,從手表、電視、電話一直到每一樣能接電的東西,它都是一個計算的工具,都是一個可以使用軟件平臺的工具,都是一個可以上網(wǎng)的工具。這就是為什么我們在Digital Decade(數(shù)字十年)這么振奮的理由。但是進入了Digital Decade(數(shù)字十年),在網(wǎng)上有無限的有格式的有架構(gòu)的這個XML的數(shù)據(jù),在網(wǎng)上有無數(shù)的網(wǎng)絡服務,你可以在網(wǎng)上訂花、買書,可以在網(wǎng)上兩個公司做彼此的交流,訂貨你可以在網(wǎng)上做無比的事情,任何你想做的事情都可以把它當做一個Web Service(Web服務),Web Service(Web服務) 可以彼此來溝通,那么Web Service(We

7、b服務)也需要和人來溝通。所以在這么豐富的Web Service(Web服務),這么豐富的 XML的環(huán)境之下,我們需要一個新的用戶界面,因為我們不可能把所有可能的想要做的工作,所有有可能的Web Service(Web服務) ,所有的XML的格式,都用圖形用戶界面顯示在你面前。因為電腦和網(wǎng)的功能變成無限的,所以你不可能在有限的屏幕上,顯示所有可以做的工作。所以圖形用戶界面將達到一個瓶頸。另外Smart Devices,智能化的設備,不是每一個設備都有屏幕的,電話沒有屏幕。我們怎么用圖形用戶界面,電話沒有鍵盤沒有鼠標,我們?nèi)绾稳ビ脠D形用戶界面?所以又是一個理由。圖形用戶界面將達到一個瓶頸,我們認

8、為未來用戶界面的發(fā)展,應該是從自然語言語音。比如說墨水或者讓電腦更像一個Tablet,一張紙,甚至有一天更像一個Personal assistant 得力的助手。我們常說的就是在Digital Decade(數(shù)字十年),我們希望將來的電腦能夠并不只是一個工具,而是一個得力的助手。這就是所謂的Natural user interface(自然用戶界面), Natural user interface(自然用戶界面),如果說 Graphical user interface(圖形用戶界面)是What you see is what you get, Natural user interface(自

9、然用戶界面) 就是Do what I mean ,我想要做什么,我就告訴你,你就幫我做了,那么它是基于technology(技術) ,我們剛剛提到的有很多Device(設備),Natural user interface(自然用戶界面)要能在各種設備上運行,有 XML,所以Natural user interface(自然用戶界面)要能夠利用有格式化的東西,有架構(gòu)的東西,有序的東西, Web Service(Web服務)所以它要能夠在Web Service(Web服務)或者是類似的。NET這樣的環(huán)境,在多平臺的從電話從手表一直到服務器上面能夠執(zhí)行。好我們需要這樣的一個用戶界面,我們希望它能夠是

10、Do What I Mean(按照我的意愿去執(zhí)行 ) ,那Do What I Mean是怎么代表的呢?當我們想做一件事情的時候,無論是我要送一束花給我太太或者是我想知道怎么把一些地址打印成為一些Address Label(地址欄),才可以寄信?;蛘呤俏蚁胫涝赪ord里面,有一個表格,我想把它一分為二,這些事情怎么去做呢?這些事情它們在我們?nèi)说哪X海里是怎么出現(xiàn)的,它是靠自然語言出現(xiàn)的。我們?nèi)藖砻枋雒恳患覀兿胱龅氖虑?,我們的意愿都是用人的語言,是用一串字來代表的。所以這一串字,如果我們能夠把冒到我們腦海的這串字直接告訴電腦讓它去執(zhí)行,這個應該是最直觀的,最自然的最容易使用的一個用戶界面。這樣的

11、一個用戶界面是自然的,因為人的語言是多年來人類發(fā)展的,可以說是人類的工程,是我們?nèi)祟惗嗝嫜葑冎筮_到的一個人類溝通的一個特別好的工具,這就是語言。這個語言是很自然的,因為我們都會語言,所以我們不需要學習,所以我們可以在更多的設備上,讓更多沒有接觸過電腦的用戶在這個Smart Device(智能設備)上使用這個自然用戶界面。第二,Scalable(可擴展性),語音可以說是惟一一個用戶界面的方法,它可以在各種不同的 Smart Device(智能設備)上使用,因為無論你有多大Screen(屏幕),無論你有沒有鍵盤,有沒有鼠標,語音都可以使用。它不局限于需要一個熒幕或者是一個鍵盤,或者是一個鼠標。那

12、最后呢,它的表達力Expressiveness非常的豐富,我們可以用語音講一句話或者用語言代表一句話,我們可以說現(xiàn)在我不接電話,直到我演講為止,或者我說現(xiàn)在我不接電話,直到我演講為止,除非是比爾·蓋茨打來,這樣的一句話。用圖形用戶界面絕對不可能表達,所以我們需要語言的豐富的語言才能夠表達這樣的意愿。自然用戶界面有這么一句話,Gordon E. Moore(戈登-摩爾)曾經(jīng)說,他是一個有革命性的一個能力,他讓你能夠自然地和電腦講話。那么電腦呢,會理解你說的是什么意思,在你的一個Context (內(nèi)容)之中知道你說什么意思,Gordon E. Moore(戈登-摩爾)大家都知道,是英特爾

13、(Intel)的創(chuàng)始人之一。也是有名的摩爾定律的創(chuàng)始人,偉大的計算機方面的很有貢獻的創(chuàng)始人Gordon E. Moore(戈登-摩爾)。他說過這樣的一句話,是在2002年接受美國總統(tǒng)獎章的時候說的,那我舉一句話是什么意思呢?因為可能有人會懷疑,是不是語音的技術,是不是語言的技術能夠足夠地成熟,能夠足夠地達到真的是Do What I Mean(按照我的意愿去執(zhí)行 ) 這種地步,能不能達到?我們都知道Moores Law(摩爾定律)告訴我們每18個月,計算機的速度會變快,會翻一番,會變快一倍。那語音方面呢?語言的理解呢?這個就是在 GordonE·Moore(戈登-摩爾) 參加美國總統(tǒng)獎

14、章授予的時候,他說的一個新的定律,叫做超級摩爾定律。超級摩爾定律就是告訴我們的是不但計算越來越快,越來越便宜,而且技術越來越好,語音的技術我們可以去衡量。它的犯錯率,今天語音識別的技術的犯錯率,和人的犯錯率大家可以看到,大約還有一個數(shù)量級的差別。但是如果我們把歷史撥回去十年或二十年,我們發(fā)現(xiàn)每一年我們都可以完全地期望語音識別比前一年更好10,也就是說去年它如果犯100個錯,今年就只犯90個錯,明年就會只犯81個錯。照這樣數(shù)量的下降呢,肯定有一天,自然語言的識別自然語音的理解,會達到人的能力,人的語音識別的精準度。語音識別當然比較復雜一點,不是說計算機快了,就自然而然的就好了,而這是一個組合,更

15、快的計算機,更好的算法,加上更多的數(shù)據(jù),促成了語音這個行業(yè)每年都有可以預期的10的進步。所以我們可以確定地說在十年到二十年之內(nèi),計算機的語音識別會達到人的能力,這是非常振奮的一件事情,也就是說,我們只要繼續(xù)努力的工作,自然用戶界面一定有來到的一天,這只是語音,當然還有很多技術,也是基本上在這個原理上每年比前一年做得更好?,F(xiàn)在我想講的是在自然語言方面的處理,將有什么樣的一個計劃。我們的想法是這樣的,我們當然有一天希望我們當然希望明天就能夠到電腦上和它自然語言溝通,但是有很多很多的問題,一方面是技術,還要靠每年的進步,不是今天的技術,就能達到這種科幻小說上面的能力,這要經(jīng)過十年或二十年的努力才能達

16、到。第二個問題是人們并不習慣和它的電腦講話,所以我們就算把這個能力做進去了,也不見得是能夠被這個社會馬上所接受的。第三,我們微軟公司做平臺的工作,我們深深地理解,平臺不能夠促使用戶們的接受一個技術,需要應用軟件才能夠促使它的接受。所以,今天我們必須要讓未來的語言語音進入了未來的應用軟件,然后在平臺上給它最好的支持,這樣才有一天有希望能夠做到。所以這就是為什么我們說Practical計劃(實際的計劃),我們不是夢想明天就可以跟電腦講話,而且跟人溝通一樣的自然,我們是一步一步地來,那這一步一步怎么來呢?我們第一挑選最自然,最合理的一個啟發(fā)點。語音我們就用電話來做,不要用PC來做,因為大家不愿意和電

17、腦講話,但是每個人都會對電話講話。如果說我能夠用語音的方法接電話,我就能夠幫一個航線,幫中國航空公司,幫中國民航,它能夠接電話告訴你你的航班幾點抵達,甚至幫你訂票。我可以幫一個股票經(jīng)濟商,幫你購買你需要買的股票,或者甚至問你要不要買某一個股票,也就是說,語音在電話上就像一個人和你對話一樣,但是是機器在做的事情,但是因為電話是一個我們很自然愿意講話的工具,人們就會更容易地接受它。第二,我們不只是用講話的,我們可以用打字的。我們有鍵盤,那在什么情況之下人們會用打字的方法輸入自然語言在一個電腦里面呢?這有兩個地方一個是Search(搜索),不管是網(wǎng)上的搜索引擎還是在電腦上面搜索您想要的檔案,這都是搜

18、索?;蛘呤荋elp,幫助,這也挺有意思的。因為我們想要做一點事情,我在Word里我想知道怎么把一個表格一分為二?這句話現(xiàn)在是要人經(jīng)過把這句話轉(zhuǎn)換成圖形用戶界面來做它,但是人可能不知道怎么轉(zhuǎn)換,但是當你不知道的時候,你就會打開Help(幫助),然后就問它,把這幾個字打進去問它。所以這兩個是非常合理地把自然語言處理的方法放進Windows平臺里面,能夠更好地支持搜索,能夠更好地支持對用戶的幫助。我們非常實際地務實地一步一步來,在這兩個 Speech for Telephone and Typing with Searching Help的方向呢,我們一步一步地來,把用戶界面一步做得比另一步更好。但

19、是我們的第一步,如果用戶用完以后,并不覺得有自然用戶界面,或自然語言處理的功能,我們并不沮喪,只要他認為說這個Search(搜索)越做越好,我們就挺開心的。我們再一步一步地往下做下去,另外我們并不是一個認為自然用戶界面將取代圖形用戶界面。雖然在電話上你沒有圖形,那當然是可以取代的,但是在PC上面其實更合理的是應該用自然語言的方法,自然用戶界面的方法,來輔助已存的圖形用戶界面,因為人們還是更習慣地用圖形用戶界面,他們不希望看到一個革命性的徹底的一個新的功能,或者一個新的用戶界面。第三,這個基礎我們是用.NET來做的,所以這一整套系統(tǒng)我們是重新開發(fā)的。我回到美國總部之后呢,我們就在.NET的基礎上

20、用Visual Studio(可視化控件)來幫助我們的Developer (開發(fā)人員),能夠把已存的應用軟件加入語音的功能,加入自然用戶界面的功能。我們在.NET Framework(.NET架構(gòu))上開發(fā)這一整套系統(tǒng),我們利用XML Web Service(XML Web服務)能夠讓不同的系統(tǒng)能夠彼此溝通。所以.NET對我們的用戶界面是非常需要的一個低層的支持和技術,因為.Net可以在多種的設備上使用,所以我們也認為經(jīng)過.NET我們可以在電話、電視機、汽車、 電器上都可以使用我們的自然的用戶界面。所以我們怎么走這條路呢。第一在Telephony上,就像我們剛才所說的,Text Speech(語

21、音合成)、Speech Recognition(語音識別)、Dialogue(對話)也就是說人機對話的溝通,在PC上我們要做搜索,要做幫助。再下一步 Q&A(問與答),我有任何的一個問題我問你,你給我你的答案,這個問題可能是說我明天開會在什么地方,也可能是問一個比如說百科全書的問題,比爾蓋茨財富到底有多少?我們能不能有一天做出這樣的Q&A(問與答)的系統(tǒng),這是一步一步來的,從左是時間的開始,到右邊是未來的方向,那么剛開始你可以看到語音跟文字是分開的,但將來我會經(jīng)過多通道用戶界面,在任何的機器上它都可以支持語音手寫體或者是打字輸入,也可以從這些已有的這些功能,左邊的這些功能做到D

22、elegation, Delegation就是委托式的用戶界面,也就是說我們用戶我希望告訴我的PC,不是一步一步怎么做一件事情,而是最后我要得到什么樣的結(jié)果,而我聰明的PC會幫我計劃一步一步地完成它。還有Federation(聯(lián)盟),就是說,我要求我的PC做一件事情,它不會做,但是它知道別的PC,或者別的Web Service(Web服務)可以做,它可以經(jīng)過我委托它,它再委托別人去幫我做這件事情。再下一步Collective Agent(集中式代理),這個 Agent(代理)用戶界面就是說不是我做用戶來啟動每一件事情,而是計算機可以主動地說,發(fā)生了什么什么事,你要不要怎么怎么做。比如說微軟的股

23、票超過四十塊了,要不要賣,這個不見得是我人去主動地要求的,而是我很早地要求我得力的計算機助手幫我留意著微軟的股票超到某一個程度,就要買或者要賣。當然把這個做好還需要Planning,也就是計劃方面的工作。我們舉一些例子,用語音怎么做呢?打電話買一百股微軟,好買了,這就是語音的一個對話。Dialogue(對話)我可以說買微軟的股票,它會說要買多少股,我說一百股,這就是一個對話,我講一句它講一句,我講一句,輪流的.從語音的角度來看呢,我們認為Smart Device(智能設備)跟語音是有非常大的關系的,因為今天我們可以把所有的設備分成這兩個軸,從y的軸我們看到的是基本上是說它的Screen,它的顯

24、示器有多好.從x軸來說呢,我們說它的輸入,比如說鍵盤或者鼠標有多好.當然PC是在右上方的,因為它有很大的Screen(屏幕),又有Keyboard(鍵盤), 又有Mouse(鼠標),電話是最差的,因為它又沒有Screen(屏幕)又沒有Keyboard(鍵盤)。其實呢,還有很多其他的設備,這些設備包括Tablet PC,PDA(個人數(shù)字助理),Screen Phone(可視電話),汽車或者TV,這些市場今天都比較小,但是很重要的是在下八年,到2010年的時候我們會看到的是 Screen Phone(可視電話) 和PDA(個人數(shù)字助理) 會越來越大。更多的汽車也會變成有計算的功能,也可以上網(wǎng)。更多

25、的電視也會有計算的功能,也可以上網(wǎng),而Tablet PC會成為更主流的技術。也就是說,有更多的平臺,有更多設備的平臺,上面是急需語音的一個輸入的一個方法。我們在左下方,也就是說Screen(屏幕)非常糟的情況之下,那么語音呢,就可以不要理會它的 Screen(屏幕),我們直接語音對語音地(來)做一個對話。當你有一個小小的 Screen(屏幕)的時候,我們也許可以用(語音)的輸入,而用圖形的輸出。所謂的 Multi Model(多模式),或者Commmnd and Control( 命令和控制),當我們Screen(屏幕)夠大的時候,這個時候我就可以做聽寫了,因為聽寫需要做修改,修改的工作需要一

26、個比較大的一個顯示。所以上面的這些機器呢,比如說Tablet PC和語音的聽寫,是一個很好的結(jié)合,所以這幾個是語音的很好的機會,那么下面我將做幾個語音方面的演示。第一個演示,我現(xiàn)在要打電話到美國,這是我們微軟公司用SALT技術在用.NET技術和SALT技術做出來的一套系統(tǒng),這套系統(tǒng)呢,我們將在中國的Visual Studio(可視化控件) 的比賽讓中國的學生甚至比美國的學生更先能夠有機會用到這方面的技術。在這個演示里面,你們會聽到的是有一個很聰明的電腦代理,他會跟我有一段對話,那么我要他做一件事,它會做一件事,這套系統(tǒng)呢,是用Visual Studio(可視化控件)開發(fā)出來的,然后微軟提供了很

27、DialogueModule(對話模塊),也就是說,開發(fā)者他編一個語音的系統(tǒng)。-410155543-您好,需要幫助嗎?-請幫我處理一下學院基金.-給我申請表.-您需要我把信以郵寄的方式還是Email的方式給您?-Email.-我已經(jīng)把信發(fā)到您的Email里了.您需要我們找個業(yè)務代表幫助您填申請表嗎?-是的,謝謝.-謝謝,我們馬上就會與您聯(lián)系.您有一封來自銀行方面的告警信,您需要我們把它傳給您嗎?-好的.-請稍等.-艾倫,您好!您有三筆帳單未付.首先是電費 $43.5,長途話費 $62.25,DSL $31.52,您愿意付帳單嗎?-付電費和長途話費.-電費和長途話費將在兩天內(nèi)交清,您還需要別的服

28、務嗎?-不用,謝謝.-請說“是”或“不是”或提出要求。您還需要別的服務嗎?-不是。這就是我們的演示。在這個演示里你聽到的是,我打電話到我的股票經(jīng)紀商,那么我要求他,我希望理解怎么樣去存錢,為了我的小孩的未來的教育,然后他就問了我很多話,最后決定把一些信息寄到我的Email Address里邊。這個時候正好我的銀行的有很多新的帳單要付,他就把我轉(zhuǎn)換到另外一個部門。這個時候就有一位女士的聲音出來,和我做了一個交談,我決定把一些帳單付清了,另外一些帳單呢,還沒有付清,這是這樣的一個未來可以做到的一個交流的過程。我們預期這個產(chǎn)品應該在今年可以做完,所以在明年我們就可以看到很多的應用,讓人們能更快地把一

29、個已有的 .NET Application(.NET應用),加上語音。這個應用本來是在PC上在Web上應用的,它突然就可以幫你接電話了。好,下面我要做的是一個另外的語音方面的演示。我們剛剛所說的語音呢,它有語音合成,還有語音識別?,F(xiàn)在我要演示的是微軟亞洲研究院的一個工作,大家都知道在亞洲研究院,語音是一個重點研究的項目?,F(xiàn)在我要演示的呢,是一個語音合成。這套語音合成系統(tǒng)它最特殊的地方是,第一它非常的自然,第二它能夠中文和英文混著說,而且是用同一個語音來說。讓我們聽聽這個聲音離人的聲音還有多大的距離。2003年2月27日,新一代軟件技術展望大會在京召開,微軟CEO兼CSA比爾蓋茨先生將親臨現(xiàn)場與

30、中國大學生面對面,蓋茨先生將為微軟亞洲研究院主辦的微軟杯XML Web Service(XML Web服務)學生軟件開發(fā)大賽獲獎團隊頒獎,并做題目為Digital Decade(數(shù)字十年)的主題演講。好,謝謝。這個技術我們非常的自豪,我估計它的中文已經(jīng)超過了我的中文的能力了,不過我的英文還比它好一點。再下面我們所要看到的是我們在總部最近拍的一個 Video(錄像)。也就是說,我們把一些技術,我們已做好的技術,在一些日常的環(huán)境上讓大家更能理解語音它不是一個很玄的技術,是真的每天任何的一個人都有可能用到的。-歡迎致電(自動化處方服務). 請說您的名字。-簡·賽門。-請輸入或說出您的個人標

31、識號或者密碼。- Connecticut-歡迎,賽門夫人. 您需要重新填寫還是修改您的處方?-修改。- 您共有兩個處方,您希望修改哪一個?-Claro-您的Claro處方將在一個小時內(nèi)準備好。-太好了。-您今天還需要別的什么服務嗎?-是的。給我丈夫的手機打電話讓他過來取處方。-正在通知他.-3月15日(周五)下午16: 15,811直達航班離開,3月19日(周二)下午13:30 831直達航班返回。您需要我現(xiàn)在就預定航班嗎?-對,預定航班.-謝謝,我們將把您的電話轉(zhuǎn)到旅游高級會員業(yè)務部門以便讓您確認。-您好。我的名字是邁克。您前往拉斯維加斯的航班已經(jīng)按照您的意思預定好了。因為您是我們的高級會員

32、,我們將給您一個特殊的折扣價,及包括晚餐和演出在內(nèi)的娛樂服務,需要我更詳盡地為您解釋嗎?-呼叫我的秘書。- 歡迎到來,您說您的密碼。- 123。- 歡迎您,泰樂薩。需要幫助嗎?-為我的部門安排一次會議。-請告訴參加會議的名單。-有Rack Sherman(人名), Christine Constant (人名)和Mary Louise(人名).-請告訴會議的主題.-我們與約翰遜公司的合同.-請告訴會議的地點-在我辦公室里-請告訴會議的時間-本周四下午2:00,會議將持續(xù)一個小時。-Christine(人名)在會議日程上有沖突.- 無論如何請給他一個邀請,并告訴他這是緊急會議?;仡^再與我確認是否

33、所有的參加者都能參加會議。-還有什么別的我可以為您效勞嗎?-請查一下我的收件箱.-您有四封信,其中有一封是急件.- 念給我聽.-泰樂薩先生.-您好,這里是您的自動秘書,所有要求參加會議的人員都接受了邀請.-太好了-讓我們求助于網(wǎng)絡.- Bridge 大街16號發(fā)生火災。-告訴我們具體情形.最新的報告是,最嚴重的火災破壞是再房間的西北角,在煙囪周圍。這與火災假設的起因相吻合。我的建議是接受這個聲明。- 把別的照片發(fā)給火警報告中心,讓火警報告中心的財產(chǎn)損失小組估算火災損失,并通過Email給房主一個拷貝。-我可以為你效勞嗎?-您好,這里是金融自動提醒服務,您是Mary Anderson(人名)嗎?

34、-是的-請說出或輸入四位個人標識代碼.-5489-謝謝。您付給了Atlantic(公司名)的代碼為6233的帳單后將使您的帳戶余額為負,需要我們激活您的帳戶透支業(yè)務嗎?- 不用,查一下我市場帳戶的余額.-您的市場帳戶的余額為14862.70美元.-從市場帳戶轉(zhuǎn)帳1000美元到我的主帳戶上.-轉(zhuǎn)帳成功,您還有什么需要效勞的嗎?-謝謝,暫時沒有.-環(huán)宇航空公司.-歡迎致電環(huán)宇航空公司自動服務中心,請說您的名字和個人標識代碼.- Eric Williams(人名). 2323.-您好,我可以為你效勞嗎?-我想要復查一下.-告訴我您的航班號.-5516.-您對座位安排有什么特殊要求嗎?-我喜歡在前面的

35、靠窗或走廊的座位.-您現(xiàn)在看到的是符合您要求的剩余座位情況。- 9A可以嗎?-座位 9A 預定給了.-您今天需要登記行李嗎?-是的.-請前往B6窗口.這個演示到此為止,就是我們認為在未來的電話上很多的機會,那么我們看到的每一個演示呢,它除了用電話交流之外,我們也看到的有些用手機它有熒幕,能夠用的時候,它就利用到了它。我們也看到了有一個網(wǎng)頁,網(wǎng)頁上有一些字出現(xiàn),當它講話的時候,這什么意思,這就是在服務端,這個系統(tǒng)其實我們是用Web Service(Web 服務)做的。那么我們只是讓人用電話能跟Web Service(Web 服務) 講話,這個Web Service(Web 服務)上面的Form(

36、組成),其實是看不到的,但是為了讓大家理解,我們把Web(網(wǎng)絡)跟 Telephone(電話)做在一起了,我們才做了這樣特別的一個演示。我們剛才曾經(jīng)提到的,我們可以用Tablet PC,Tablet PC上面呢,做語音識別是很好的一個平臺。原因是Tablet PC雖然手寫滿方便的,而且開會的時候也只能用手寫,但是如果我們在自己的房間里,在有隱私的情況之下,手寫的速度還是挺慢的。語音的輸入可以說遠遠地超過了手寫的速度,所以我們可以用語音輸入,如果犯了錯,我們可以用筆來做修正?,F(xiàn)在我們做一個聽寫的這個演示。-開始工作。-親愛的蓋茨先生:重新開始一段非常感謝您光臨北京。北京是奧運會舉辦城市。今天我們

37、很高興有8000名來自北京各大高校的學生來歡迎您到來。-重新開始一段您的(信件格式)我們認為語音有非常多的地方可以有發(fā)揮的地方,在電話上是最主要的一個,但是在Tablet PC上, 在multi-model devices(多模式設備),在 Smart phone(智能電話)上都是很多的機會。我們現(xiàn)在回到文本的輸入,Text(文本)的輸入,Search( 搜索)。我們今天當然知道Internet上,我們到Google(搜索引擎名),到MSN Search(搜索引擎名),到Y(jié)ahoo(搜索引擎名) ,可以做簡單的一些名詞的搜索。但是未來我們搜索應該怎么做呢?未來很大的一個革命,是有結(jié)構(gòu)化的內(nèi)容,

38、 Unified Storge(統(tǒng)一存儲),也就是說,XML不但很重要,我們將有承諾,在未來的Windows,下一個版本的Windows里面呢,用 XML,用有序的 Database(數(shù)據(jù)庫)技術。數(shù)據(jù)庫的技術來作為我們的 File system(文檔系統(tǒng)),也就是說,我們每一個檔案在我們的機器上,它都會是有序的,有結(jié)構(gòu)的,也就是說,每一篇Email,我都知道是誰發(fā)來的,什么時候發(fā)來的,內(nèi)容是什么,一些關鍵詞是什么。也就是說,每一個Calendar(日程),每一個Appointment(約會) ,我和任何人開會,它都知道我在跟誰開會,在什么地方開會,幾點開會,幾點結(jié)束,然后內(nèi)容是什么,要帶什么

39、東西,它都可以一個一個靠Database File(數(shù)據(jù)庫文件)儲存。當你一個整個 File System(文件系統(tǒng)) 的每一個檔案,都有序的儲存之后,我們就可以用自然語言,來做一個數(shù)據(jù)庫的搜索。比如說我可以說我要找John(人名)寄給我的電子郵件,電子郵件的Subject(主題)是budget (預算),F(xiàn)ind email form John about the budget(找John給我的有關預算的電子郵件) 他就應該可以直接把答案找給我。今天我們搜索Email非常困難,Help(幫助)得到幫助,我可以說My printer stuck( 我的打印機卡了),或者我想打彩色的打出來的是黑

40、白的,這個時候它告訴我為什么,甚至如果是軟件的問題,不是硬件的問題,它可以幫我修好。Task(任務),Ten thousand copies in Kinkos Beijing(在北京的Kinko打印10000份),這個是一個很實際的例子,因為 Kinko(公司名)是我們的一個合作伙伴,Kinko(公司名)它有一個Web service(Web服務),Kinko(公司名)是美國打印的公司,它在北京也有一個分店,過去你都是要把你的文件帶到店里面去,一份一份地影印,但是它現(xiàn)在做了一個 Web service(Web服務),你可以遠程地去把一個文件寄給它。Web service(Web服務)它有幾個

41、參數(shù),我可以說我要把這份文件打一萬份,我叫李開復,我的帳號是什么什么,或者我的信用卡號碼是什么什么的,這都是一些有結(jié)構(gòu)的東西,我可以靠Web service(Web服務)去傳給 Kinko(公司名)。比如說蓋茨先生來中國非常趕,然后他要印一萬份東西,讓每人有一份,那他在美國印了,捧這么重的東西過來的話,他的專機可能載不下。那他怎么辦呢?他就可以說要打印一萬份,而且在北京打印,在北京取貨,下了飛機去取貨,這樣可以節(jié)省很多的時間,所以這就是所謂的一種 Task(任務)。當然 Task(任務)和Search 也很像,Search是要找一個東西要找一個結(jié)構(gòu)的,Task(任務)是有一個結(jié)構(gòu)的東西,但是我

42、不是要找它,而是要把它抓起來當做參數(shù)去執(zhí)行,所以這樣的一個Web service(Web服務)應該很有用。當然今天Kinko(公司名)還沒有一個自然用戶界面,所以你用表格的方法,Graphical user interface(圖形用戶界面)很繁雜的方法去做你的輸入。將來我們可以用自然的用戶的界面,寫完一篇文章,我就告訴它在哪里打印,打印多少份,指令了之后,它就會做到。 Q & A(問與答)我可以問一個問題, What time will Bill Gates talk end?(蓋茨的演講何時結(jié)束),你可以告訴我3:55分,如果你有一個Calendar(日程),Calendar(日程

43、)里有一個item(項目)叫Bill。Gates talk(比爾·蓋茨的演講),這個Calendar(日程)它是在3:55分結(jié)束,所以我問這個問題,它也可以有結(jié)構(gòu)地去做一個 Database Request(數(shù)據(jù)庫需求),就跟一個SQL Request(SQL語言需求)一樣的,然后把答案顯示給我看。Delegation and Federation(代理和聯(lián)盟),這個是比較未來,可能是五年以后的一些scenario(景象),Send flowers to my wife on her birthday.太太過生日的時候送花,如果我能說每年送的話,以后就不會挨罵了。Pro-Active

44、 agent(主動代理)我可以告訴它,我有很重要的演講,我不接任何電話,或者說除非是緊急的,除非是比爾·蓋茨打來的,或者除非講完了,這個時候如果你有一個很聰明的web service(web服務),它可以知道你這一秒鐘在不在演講,演講緊不緊急,你接不接電話,什么電話是緊急的,誰是你的上司,它可以把這些信息都融合進去,能夠主動地去幫你做一件事情。所謂的 Pro-Active(主動的),我吩咐它做一件事情,但是它不是馬上做,而是一直延續(xù)地做下去,它幫我接所有的電話,一直到有一天我叫它不要接為止。Planning(計劃)可能是說你要給它一個信息,而它要跟你做一個會話,對話之后它才決定最終你

45、要做什么事情。比如說我要做 Planning(計劃),第一步我想去歐洲度假,這時候它可能就問我要花多少錢,去什么國家等等的,怎么樣做這樣的一個Dialogue(對話),還是比較復雜的問題,比較未來的問題。但是我們很有信心,從上面用Speech(演講)走,從下面由自然語言走,確實可以達到的。我們剛剛所說的Structural storage,這個XML ,甚至將下一代的XML由Windows來Native(本地化)直接支持用 SQL Database(SQL數(shù)據(jù)庫)的功能。在Windows里支持每一個檔案的XML這件事發(fā)生之后呢,所謂的很多例子都可以解決,讓我們能夠把左邊的這些例子這些句子,這些自然語言轉(zhuǎn)換成右邊的SQL Query(SQL查詢),這個其他的工作就很簡單了。我們 SQL Database(SQL數(shù)據(jù)庫) ,然后得出來的結(jié)果顯示給你看,那就得了。所以我們認為非常的樂觀的就是說將來當XML真的發(fā)展好了以后,世界上的數(shù)據(jù)更多更多的結(jié)構(gòu)化的,這些結(jié)構(gòu)化的數(shù)據(jù)呢,它其實是需要一個新的搜索的新的幫助的新的執(zhí)行的一個用戶的界面

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論