大數(shù)據(jù)導論(第2版) 課件 項目3 大數(shù)據(jù)促進行業(yè)發(fā)展_第1頁
大數(shù)據(jù)導論(第2版) 課件 項目3 大數(shù)據(jù)促進行業(yè)發(fā)展_第2頁
大數(shù)據(jù)導論(第2版) 課件 項目3 大數(shù)據(jù)促進行業(yè)發(fā)展_第3頁
大數(shù)據(jù)導論(第2版) 課件 項目3 大數(shù)據(jù)促進行業(yè)發(fā)展_第4頁
大數(shù)據(jù)導論(第2版) 課件 項目3 大數(shù)據(jù)促進行業(yè)發(fā)展_第5頁
已閱讀5頁,還剩117頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

項目3大數(shù)據(jù)促進行業(yè)發(fā)展目錄1任務3.1:理解大數(shù)據(jù)促進醫(yī)療與健康2任務3.2:理解大數(shù)據(jù)激發(fā)創(chuàng)造力【導讀案例】大數(shù)據(jù)變革公共衛(wèi)生討論:(1)谷歌預測流感主要采用的是什么方法?(2)谷歌預測流感爆發(fā)的方法與傳統(tǒng)的醫(yī)學手段有什么不同?(3)在現(xiàn)代醫(yī)學的發(fā)展中,你認為大數(shù)據(jù)還會有哪些用武之地?(4)請簡單記述你所知道的上一周內發(fā)生的國際、國內或者身邊的大事。【任務描述】(1)了解循證醫(yī)學,理解大數(shù)據(jù)對循證醫(yī)學的促進作用;(2)通過因特網(wǎng)搜索與瀏覽,了解更多大數(shù)據(jù)變革公共衛(wèi)生的典型案例;(3)加深理解大數(shù)據(jù)在醫(yī)療與健康領域的應用前景?!局R準備】大數(shù)據(jù)促進醫(yī)療與健康循證醫(yī)學(Evidence-basedmedicine,EBM),意為“遵循證據(jù)的醫(yī)學”,又稱實證醫(yī)學,其核心思想是醫(yī)療決策(即病人的處理,治療指南和醫(yī)療政策的制定等)應在現(xiàn)有的最好的臨床研究依據(jù)基

礎上做出,同時也重視結合個人的臨床經(jīng)驗。圖3-2循證醫(yī)學金字塔大數(shù)據(jù)促進循證醫(yī)學發(fā)展3.1.13.1.1大數(shù)據(jù)促進循證醫(yī)學發(fā)展傳統(tǒng)醫(yī)學以個人經(jīng)驗、經(jīng)驗醫(yī)學為主,即根據(jù)非實驗性的臨床經(jīng)驗、臨床資料和對疾病基礎知識的理解來診治病人。在傳統(tǒng)醫(yī)學下,醫(yī)生根據(jù)自己的實踐經(jīng)驗、高年資醫(yī)師的指導,教科書和醫(yī)學期刊上零散的研究報告為依據(jù)來處理病人。其結果是:一些真正有效的療法因不為公眾所了解而長期未被臨床采用;一些實踐無效甚至有害的療法因從理

論上推斷可能有效而長期廣泛使用。

圖3-3傳統(tǒng)醫(yī)學是以經(jīng)驗醫(yī)學為主3.1.1大數(shù)據(jù)促進循證醫(yī)學發(fā)展循證醫(yī)學的第一位創(chuàng)始人科克倫(1909-1988),是英國的內科醫(yī)生和流行病學家,他1972年在牛津大學提出了循證醫(yī)學思想。循證醫(yī)學的第二位創(chuàng)始人費恩斯坦(1923-),是美國耶魯大學的內科學與流行病學教授,他是現(xiàn)代臨床流行病學的開山鼻祖之一。循證醫(yī)學的第三位創(chuàng)始人薩科特(1934-)也是美國人,他曾經(jīng)以腎臟病和高血壓為研究課題,先進行實驗室研究,后又進行臨床研究,最后轉向臨床流行病學的研究。3.1.1大數(shù)據(jù)促進循證醫(yī)學發(fā)展循證醫(yī)學的方法與內容實際上來源于臨床流行病學。費恩斯坦在美國的《臨床藥理學與治療學》雜志上,以“臨床生物統(tǒng)計學”為題,從1970年到1981年的11年間,共發(fā)表了57篇的連載論文,他的論文將數(shù)理統(tǒng)計學與邏輯學導入到臨床流行病學,系統(tǒng)地構建了臨床流行病學的體系,被認為富含極其敏銳的洞察能力,因此為醫(yī)學界所推崇。循證醫(yī)學不同于傳統(tǒng)醫(yī)學,它并非要取代臨床技能、

臨床經(jīng)驗、臨床資料和醫(yī)學專業(yè)知識,它只是強調

任何醫(yī)療決策應建立在最佳科學研究證據(jù)基礎上。

循證醫(yī)學實踐既重視個人臨床經(jīng)驗又強調采用現(xiàn)有

的、最好的研究證據(jù),兩者缺一不可。3.1.1大數(shù)據(jù)促進循證醫(yī)學發(fā)展1992年,來自安大略麥克馬斯特大學的兩名內科醫(yī)生戈登·蓋伊特和大衛(wèi)·薩基特發(fā)表了呼吁使用“循證醫(yī)學”的宣言。他們的核心思想很簡單,醫(yī)學治療應該基于最好的證據(jù),而且如果有統(tǒng)計數(shù)據(jù)的話,最好的證據(jù)應來自對統(tǒng)計數(shù)據(jù)的研究。但是,蓋伊特和薩基特并非主張醫(yī)生要完全受制于統(tǒng)計分析,他們只是希望統(tǒng)計數(shù)據(jù)在醫(yī)療診斷中起到更大的作用。醫(yī)生應該重視統(tǒng)計數(shù)據(jù)的這種觀點,直到今天仍頗受爭議。從廣義上來說,努力推廣循證醫(yī)學,就是在努力推廣大數(shù)據(jù)分析,事關統(tǒng)計分析對實際決策的影響。由于循證醫(yī)學運動的成功,一些醫(yī)生在把數(shù)據(jù)分析結果與醫(yī)療診斷相結合方面已經(jīng)加快了步伐?;ヂ?lián)網(wǎng)在信息追溯方面的進步促進了一項影響深遠的技術的發(fā)展,而且利用數(shù)據(jù)做出決策的過程也達到了前所未有的速度。大數(shù)據(jù)帶來醫(yī)療保健新突破3.1.23.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破根據(jù)美國疾病控制中心(CDC)的研究,心臟病是美國的第一大致命殺手,每年250萬的死亡人數(shù)中,約有60萬人死于心臟病,而癌癥緊隨其后(在中國,癌癥是第一致命殺手,心血管疾病排名第二)。在25~44歲的美國人群中,1995年,艾滋病是致死的頭號原因(現(xiàn)在已降至第六位)。死者中每年僅有2/3的人死于自然原因。那么那些情況不嚴重但影響深遠的疾病(比如普通感冒)又如何呢?據(jù)統(tǒng)計,美國民眾每年總共會得10億次感冒,平均每人3次。普通感冒是各種鼻病毒引起的,其中大約有99種已經(jīng)排序,種類之多是普通感冒長久以來如此難治的根源所在。3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破在醫(yī)療保健方面的應用,除了分析并指出非自然死亡的原因之外,大數(shù)據(jù)同樣也可以增加醫(yī)療保健的機會、提升生活質量、減少因身體素質差造成的時間和生產(chǎn)力損失。以美國為例,通常一年在醫(yī)療保健上要花費27萬億美元,即人均8650美元。隨著人均壽命增長,嬰兒出生死亡率降低,更多的人患上了慢性病并長期受其困擾。如今,因為注射疫苗的小孩增多,所以減少了五歲以下小孩的死亡數(shù)。而除了非洲地區(qū),肥胖癥已成為比營養(yǎng)不良更嚴重的問題。在比爾與美琳達·蓋茨基金會以及其他人資助的研究中,科學家發(fā)現(xiàn),雖然世界人口壽命變長,但大家的身體素質卻下降了。所有這些都表明我們亟需提供更高效的醫(yī)療保健,盡可能地幫助人們跟蹤并改善身體健康。3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破1.量化自我,關注個人健康谷歌聯(lián)合創(chuàng)始人謝爾蓋?布林的妻子安妮?沃西基(同時也是公司的首席執(zhí)行官)2006年創(chuàng)辦了DNA測試和數(shù)據(jù)分析公司23andMe。公司并非僅限于個人健康信息的收集和分析,而是將眼光放得

更遠,將大數(shù)據(jù)應用到了個人遺傳學上,

至今已分析了數(shù)十萬人的唾液(見圖3-6)。圖3-5基因DNA3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破圖3-623andMe的DNA測試3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破通過分析人們的基因組數(shù)據(jù),公司確認了個體的遺傳性疾病,如帕金森氏病和肥胖癥等遺傳傾向。通過收集和分析大量的人體遺傳信息數(shù)據(jù),該公司不僅希望可以識別個人遺傳風險因素以幫助人們增強體質并延年益壽,而且希望能識別更普遍的趨勢。通過分析,公司已確定了約180個新的特征,例如所謂的“見光噴嚏反射”,即人們從陰暗處移動到陽光明媚的地方時會有打噴嚏的傾向;還有一個特征則與人們對藥草、香菜的喜惡有關。事實上,利用基因組數(shù)據(jù)來為醫(yī)療保健提供更好的洞悉是合情合理的。人類基因計劃組(HGP)繪制出總數(shù)約有23000組的基因組,而這所有的基因組也最終構成了人類的DNA。這一項目費時13年,耗資38億美元。3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破值得一提的是,存儲人類基因數(shù)據(jù)并不需要多少空間。有分析顯示,人類基因存儲空間僅占20兆字節(jié),和在iPod中存幾首歌所占的空間差不多。其實隨意挑選兩個人,他們的DNA約99.5%都完全一樣。因此,通過參考人類基因組的序列,我們也許可以只存儲那些將此序列轉化為個人特有序列所必需的基因信息。DNA最初的序列在捕捉的高分辨率圖像中顯示為一列DNA片段。雖然個人的DNA信息以及最初的序列形式會占據(jù)很大空間,但是,一旦序列轉化,任何人的基因序列就都可以被高效地存儲下來。3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破數(shù)據(jù)規(guī)模大并不一定能稱其為大數(shù)據(jù)。真正體現(xiàn)大數(shù)據(jù)能量的是不僅要具備收集數(shù)據(jù)的能力,還要具備低成本分析數(shù)據(jù)的能力。雖然人類最初的基因組序列分析耗資約38億美元,不過,如今個人只需花大概99美元就能在23andMe網(wǎng)站上獲取自己的DNA分析。業(yè)內專家認為,基因測序成本在短短10年內跌了幾個數(shù)量級。當然,僅有DNA測序不足以提升我們的健康,我們也需要在日常生活中做出改變。3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破2.可穿戴的個人健康設備Fitbit是美國的一家移動電子醫(yī)療公司(見圖3-7),致力于研發(fā)和推廣健康樂活產(chǎn)品,從而幫助人們改變生活方式,其目標是通過使保持健康變得有趣來讓其變得更簡單。2015年6月19日Fitbit上市,成為紐約證券交易所可穿戴設備的第一股。該公司所售的一款設備可以跟蹤你一天的身體活動,還有晚間的睡眠模式。Fitbit公司還提供一項免費的蘋果手機應用程序,可以讓用戶記錄他們的食物和液體攝入量。通過對活動水平和營養(yǎng)攝入的跟蹤,用戶可以確定哪些有效、哪些無效。營養(yǎng)學家建議,準確記錄我們的食物和活動量是控制體重的最重要一環(huán),因為數(shù)字明確且具有說服力。3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破圖3-7Fitbit設備3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破Fitbit公司正在收集關于人們身體狀況、個人習慣的大量信息。如此一來,它就能將圖表呈現(xiàn)給用戶,從而幫助用戶直觀地了解自己的營養(yǎng)狀況和活動水平,而且,它能就可改善的方面提出建議。耐克公司推出了類似的產(chǎn)品Nike+FuelBand,即一條可以戴在手腕上收集每日活動數(shù)據(jù)的手環(huán)。這一設備采用了內置加速傳感器來檢測和跟蹤每日的活動,諸如跑步、散步以及其他體育運動。加上NikePlus網(wǎng)站和手機應用程序的輔助,這一設備令用戶可以更加方便地跟蹤自己的活動行為、設定目標并改變習慣。耐克公司也為其知名的游戲系統(tǒng)提供訓練計劃,使用戶在家也能健身。使用這一款軟件,用戶就可以和朋友或其他人在健身區(qū)一起訓練。這一想法旨在讓健身活動更有樂趣、更加輕松,同時也更社交化。3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破另一款設備是可穿戴技術商身體媒體公司(BodyMedia)推出的BodyMedia臂帶,它每分鐘可捕捉到5000多個數(shù)據(jù)點,包括體溫、汗液、步伐、卡路里消耗及睡眠質量等。Strava公司通過將這些挑戰(zhàn)搬到室外,把現(xiàn)實世界的運動和虛擬的比賽結合在一起。公司推出的適用于蘋果手機和安卓系統(tǒng)的跑步和騎車程序,為充分利用體育活動的競技屬性而經(jīng)過了專門的設計。健身愛好者可以通過拍攝各種真實的運動片段來角逐排行榜,比如挑戰(zhàn)單車上險坡等,并在Strava網(wǎng)站上對他們的情況進行比較。3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破據(jù)出自美國心臟協(xié)會的文章《非活動狀態(tài)的代價》稱,65%的成年人不是肥胖就是超重。自1950年以來,久坐不動的工作崗位增加了83%,而僅有25%的勞動者從事的是身體活動多的工作。美國人平均每周工作47個小時,相比20年前,每年的工作時間增加了164個小時。而肥胖的代價就是,據(jù)估計,美國公司每年與健康相關的生產(chǎn)力損失高達2258億美元。因此,類似Fitbit和Nike+FuelBand這樣的設備對不斷推高醫(yī)療保健和個人健康的成本確實有影響。3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破另一個蘋果手機的應用程序可以通過審視面部或檢測指尖上脈搏跳動的頻率來檢查心率。生理反饋應用程序公司Azumio的程序被下載了2000多萬次,這些程序幾乎無所不能,從檢測心率到承壓水平測試都可以。隨著前來體驗測量的用戶數(shù)據(jù)不斷增加,公司就足以提供更多建設性的保健建議。3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破Azumio公司已推出了一款叫“健身達人”的健身應用程序,還有一款叫做“睡眠時間”的應用,它可以通過蘋果手機檢測睡眠周期,這樣的應用程序為大數(shù)據(jù)和保健相結合提供了可能性。通過這些應用程序收集到的數(shù)據(jù),我們可以了解正在發(fā)生什么以及我們的身體狀況走勢怎樣。比如說,如果心率不齊,就表示健康狀況出現(xiàn)了某種問題。通過分析數(shù)百萬人的健康數(shù)據(jù),科學家們可以開發(fā)更好的算法來預測我們未來的健康狀況。將這種數(shù)據(jù)收集能力、低成本的分析、可視化云服務與大數(shù)據(jù)以及個人健康領域相結合,將在提升健康狀況和減低醫(yī)療成本方面發(fā)揮出巨大的潛力。3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破回溯過去,檢測身體健康發(fā)展情況需要用到特殊的設備,或是不辭辛苦、花費高額就診費去醫(yī)生辦公室問診。新型應用程序最引人矚目的一面是,它們使得健康信息的檢測變得更簡單易行。低成本的個人健康檢測程序以及相關技術甚至“喚醒”了全民對個人健康的關注。就如大數(shù)據(jù)的其他領域一樣,改善醫(yī)療和普及醫(yī)療的進展前景位于兩者的交匯處——相對低價的數(shù)據(jù)收集感應器的持續(xù)增多,如蘋果手機和為其定制的醫(yī)療附加軟件,以及這些感應器生成的大數(shù)據(jù)量的攀升。通過把病例數(shù)字化和能為醫(yī)生提供更優(yōu)信息的智能系統(tǒng)相結合,不管是在家還是醫(yī)診室,大數(shù)據(jù)都有望對我們的身體健康產(chǎn)生重大影響。3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破3.大數(shù)據(jù)時代的醫(yī)療信息就算有了這些可穿戴設備與應用程序,我們依然需要去看醫(yī)生。大量的醫(yī)療信息收集工作依然靠紙筆進行。紙筆記錄的優(yōu)勢在于方便、快捷、成本低廉。但是,因為紙筆做的記錄會分散在多處,這就會導致醫(yī)療工作者難以找到患者的關鍵醫(yī)療信息。3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破2009年頒布的美國《衛(wèi)生信息技術促進經(jīng)濟和臨床健康法案》(HITECH)旨在促進醫(yī)療信息技術的應用,尤其是電子健康檔案(EHRs)的推廣。法案也在2015年給予醫(yī)療工作者經(jīng)濟上的激勵,鼓勵他們采用電子健康檔案,同時會對不采用者施以處罰。電子病歷(EMRs,見圖3-8)是紙質記錄的電子檔,如今許多醫(yī)生都在使用。相比之下,電子健康檔案意圖打造病人健康概況的普通檔案,這使得它能被醫(yī)療工作者輕易接觸到。醫(yī)生還可以使用一些新的APP應用程序,在蘋果平板電腦、蘋果手機、搭載安卓系統(tǒng)的設備或網(wǎng)頁瀏覽器上收集病人的信息。除了可以收集過去用紙筆記錄的信息之外,醫(yī)生們還將通過這些程序實現(xiàn)從語言轉換到文本的聽寫、收集圖像和視頻等其他功能。3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破圖3-8電子病歷3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破電子健康檔案、DNA測試和新的成像技術在不斷產(chǎn)生大量數(shù)據(jù)。收集和存儲這些數(shù)據(jù)對于醫(yī)療工作者而言是一項挑戰(zhàn),也是一個機遇。不同于以往采用的封閉式的醫(yī)院IT系統(tǒng),更新、更開放的系統(tǒng)與數(shù)字化的病人信息相結合可以帶來醫(yī)療突破。如此分析也會給人們帶來別樣見解。比如說,智能系統(tǒng)可以提醒醫(yī)生使用與自己通常推薦的治療方式相關的其他治療方式和程序。這種系統(tǒng)也可以告知那些忙碌無暇的醫(yī)生某一領域的最新研究成果。這些系統(tǒng)收集、存儲的數(shù)據(jù)量大得驚人。越來越多的病患數(shù)據(jù)會采用數(shù)字化形式存儲。不僅是我們填寫在健康問卷上或醫(yī)生記錄在表格里的數(shù)據(jù),還包括了蘋果手機和蘋果平板電腦等設備以及新的醫(yī)療成像系統(tǒng)(比如X光機和超音設備)生成的數(shù)字圖像。3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破就大數(shù)據(jù)而言,這意味著未來將會出現(xiàn)更好、更有效的患者看護,更為普及的自我監(jiān)控以及防護性養(yǎng)生保健,當然也意味著要處理更多的數(shù)據(jù)。其中的挑戰(zhàn)在于,要確保所收集的數(shù)據(jù)能夠為醫(yī)療工作者以及個人提供重要的見解。3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破4.CellMiner,對抗癌癥的新工具所謂PSA,即前列腺特異抗原,PSA偏高與前列腺癌癥緊密相關。即使檢查本身并沒有顯示有癌細胞,而PSA偏高的人通常會被診斷出患有前列腺癌。是否所有PSA高的人都患有癌癥,這難以確診。對此,一方面,患者可以選擇不采取任何行動,但是必須得承受病癥慢慢加重的心理壓力,也許終有一日會遍至全身,而他已無力解決;另一方面,患者可以采取行動,比如進行一系列的治療,從激素治療到手術切除,再到完全切除前列腺,但結果也可能更糟。選擇對于患者而言,既簡單又復雜。3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破這其中包含兩個數(shù)據(jù)使用方面的重要經(jīng)驗教訓:數(shù)據(jù)可以幫助我們看得更深入。數(shù)據(jù)可以傳送更多的相關經(jīng)驗,使得計算機能夠預知我們想看的電影、想買的書籍。但是,涉及醫(yī)藥治療時,通常來說,就如何處理這些見解這一問題,制訂決策可不容易。數(shù)據(jù)提供的見解會不斷變化發(fā)展。這些見解都是基于當時的最佳數(shù)據(jù)。正如試圖通過模式識別出詐騙的詐騙檢測系統(tǒng)在基于更多數(shù)據(jù)時能配備更好的算法并實現(xiàn)系統(tǒng)優(yōu)化一樣,當我們掌握了更多的數(shù)據(jù)后,對于不同的醫(yī)療情況會有不同的推薦方案。3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破對男性來說,致死的癌癥主要是肺癌、前列腺癌、肝癌以及大腸癌,而對于女性來說,致死的癌癥主要是肺癌、乳腺癌和大腸癌。抽煙是引起肺癌的首要原因。1946年抽煙人數(shù)占美國人口的45%,1993年降至25%,到了2010年降至19.3%。但是,肺癌患者的五年生存率僅為15%,且這一數(shù)字已經(jīng)維持40年未變。盡管如今已經(jīng)是全民抗癌,但目前仍沒有癌癥防治的通用方法,很大原因就在于癌癥并不止一種——目前已發(fā)現(xiàn)200多種不同種類的癌癥。3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破美國國家癌癥研究所(NCI)每年用于癌癥研究的預算約為50億美元,他們取得的最重大進展就是開發(fā)了一些測試,可以檢測出某些癌癥,比如2004年開發(fā)的預測結腸癌的簡單血液測試,其他進展包括將癌癥和某些特定病因聯(lián)系在一起。比如1954年一項研究首次表明吸煙和肺癌有很大關聯(lián),1955年的一項研究則表明男性荷爾蒙睪丸素會促生前列腺癌,而女性雌激素會促生乳腺癌。當然,更大的進展還是在癌癥治療方法上。比如,發(fā)現(xiàn)了樹突狀細胞,這是提取癌癥疫苗的基礎;還發(fā)現(xiàn)了腫瘤通過生成一個血管網(wǎng),為自己帶來生長所需的氧氣的過程。3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破NCI研制的“細胞礦工”(CellMiner)是一個基于網(wǎng)絡形式、涵蓋了上千種藥物的基因組靶點信息的工具,它為研究人員提供了大量的基因公式和化學復合物數(shù)據(jù)。這樣的技術讓癌癥研究變得高效。該工具可幫助研究人員用于抗癌藥物與其靶點的篩選,極大提高了工作效率。通過藥物和基因靶點的海量數(shù)據(jù)相比較,研究者可更容易的辨別出針對不同的癌細胞具有不同效果的藥物。過去,處理這些數(shù)據(jù)集意味著要處理運作不便的數(shù)據(jù)庫,因而,分析和匯聚數(shù)據(jù)也就異常艱難。從歷史角度來看,想用數(shù)據(jù)來解答疑問和可以接觸到這些數(shù)據(jù)的人不重疊且有很大代溝。而如“細胞礦工”一樣的科技正是縮小這一代溝的工具。3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破研究者們用“細胞礦工”的前身,即一個名為“對比”(COMPARE)的程序來確認一種具備抗癌性的藥物,事實證明,它確實有助于治療一些淋巴瘤。而現(xiàn)在,研究者們使用“細胞礦工”弄清生物標記,以了解治療方法有望對哪些患者起作用。CellMiner軟件以60種癌細胞為基礎,其NCI-60細胞系是目前使用最廣泛的用于抗癌藥物測試的癌細胞樣本群(見圖3-9)。用戶可以通過它查詢到NCI-60細胞系中已確認的22379個基因,以及20503個已分析的化合物的數(shù)據(jù)(包括102種已獲美國食品和藥物監(jiān)督局批準的藥物)。3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破圖3-9裝載NCI-60細胞系的細胞板3.1.2大數(shù)據(jù)帶來醫(yī)療保健新突破研究者認為,影響力最大的因素之一是可以更容易地接觸到數(shù)據(jù)。這對于癌癥研究者,或是對那些想充分利用大數(shù)據(jù)的人而言是至關重要的一課——除非收集到的大量數(shù)據(jù)可以輕易為人所用,否則他們能發(fā)揮的作用就很有限。大數(shù)據(jù)民主化,即開放數(shù)據(jù),至關重要。醫(yī)療信息數(shù)字化3.1.33.1.3醫(yī)療信息數(shù)字化醫(yī)療領域的循證試驗已經(jīng)有一百多年的歷史了。早在19世紀40年代,奧地利內科醫(yī)生伊格納茨·塞麥爾維斯就在維也納完成了一項關于產(chǎn)科臨床的詳細的統(tǒng)計研究。塞麥爾維斯在維也納大學總醫(yī)院首次注意到,如果住院醫(yī)生從驗尸房出來后馬上為產(chǎn)婦接生,產(chǎn)婦死亡的概率更大。當他的同事兼好朋友杰克伯?克萊斯卡死于剖腹產(chǎn)時的熱毒癥時,塞麥爾維斯得出一個結論:孕婦分娩時的發(fā)燒具有傳染性。他發(fā)現(xiàn),如果診所里的醫(yī)生和護士在給每位病人看病前用含氯石灰水洗手消毒,那么死亡率就會從12%下降到2%。3.1.3醫(yī)療信息數(shù)字化這一最終產(chǎn)生病理細菌理論的驚人發(fā)現(xiàn)遇到了強烈的阻力,塞麥爾維斯也受到其他醫(yī)生的嘲笑。他主張的一些觀點缺乏科學依據(jù),因為他沒有充分解釋為什么洗手會降低死亡率,醫(yī)生們不相信病人的死亡是由他們所引起的,他們還抱怨每天洗好幾次手會浪費他們寶貴的時間。塞麥爾維斯最終被解雇,后來他精神嚴重失常,并在精神病院去世,享年47歲。塞麥爾維斯的死是一個悲劇,成千上萬產(chǎn)婦不必要的死亡更是一種悲劇,不過它們都已成為歷史,現(xiàn)在的醫(yī)生當然知道衛(wèi)生的重要性。然而時至今日,醫(yī)生們不愿洗手仍是一個致命的隱患。不過最重要的是,醫(yī)生是否應該因為統(tǒng)計研究而改變自己的行為方式,至今仍頗受質疑。3.1.3醫(yī)療信息數(shù)字化唐·博威克是一名兒科醫(yī)生,也是保健改良協(xié)會的會長,他鼓勵進行一些大膽的對比試驗。十幾年以來,博威克一直致力于減少醫(yī)療事故,他也與塞麥爾維斯一樣努力根據(jù)循證醫(yī)學的結果提出簡單的改革建議。1999年發(fā)生的兩件不同尋常的事情,使得博威克開始對醫(yī)院系統(tǒng)進行廣泛的改革。第一件事是,醫(yī)學協(xié)會公布的一份權威報告,記錄了美國醫(yī)療領域普遍存在的治療失誤。據(jù)該報告估計,每年醫(yī)院里有98000人死于可預防的治療失誤。醫(yī)學協(xié)會的報告使博威克確信治療失誤的確是一大隱患。3.1.3醫(yī)療信息數(shù)字化第二件事是發(fā)生在博威克自己身上的事情。博威克的妻子安患有一種罕見的脊椎自體免疫功能紊亂癥。在3個月的時間里,她從能夠完成28公里的阿拉斯加跨國滑雪比賽變得幾乎無法行走。使博威克震驚的是,他妻子所在醫(yī)院懶散的治療態(tài)度。每次新?lián)Q的醫(yī)生都不斷重復地詢問同樣的問題,甚至不斷開出已經(jīng)證明無效的藥物。主治醫(yī)生在決定使用化療來延緩安的健康狀況的“關鍵時刻”之后的足足60個小時,安才吃到最終開出的第一劑藥。而且有3次,安被半夜留在醫(yī)院地下室的擔架床上,既惶恐不安又孤單寂寞。3.1.3醫(yī)療信息數(shù)字化安住院治療,博威克就開始擔心。他已經(jīng)失去了耐性,他決定要做點什么了。2004年12月,他大膽地宣布了一項在未來一年半中挽救10萬人生命的計劃?!?0萬生命運動”是對醫(yī)療體系的挑戰(zhàn),敦促它們采取6項醫(yī)療改革來避免不必要的死亡。他并不僅僅希望進行細枝末節(jié)的微小變革,也不要求提高外科手術的精度。不,與之前的塞麥爾維斯一樣,他希望醫(yī)院能夠對一些最基本的程序進行改革。例如,很多人做過手術后處于空調環(huán)境中會引發(fā)肺部感染。隨機試驗表明,簡單地提高病床床頭,以及經(jīng)常清洗病人口腔,就可以大大降低感染的幾率。博威克反復地觀察臨危病人的臨床表現(xiàn),并努力找出可能降低這些特定風險的干預方法的大規(guī)模統(tǒng)計數(shù)據(jù)。3.1.3醫(yī)療信息數(shù)字化循證醫(yī)學研究也建議進行檢查和復查,以確保能夠正確地開藥和用藥,能夠采用最新的心臟電擊療法,以及確保在病人剛出現(xiàn)不良癥狀時就有快速反應小組馬上趕到病榻前。因此,這些干預也都成為“10萬生命運動”的一部分。然而,博威克最令人吃驚的建議是針對最古老的傳統(tǒng)。他注意到每年有數(shù)千位ICU(重癥加強護理病房)病人在胸腔內放

置中央動脈導管后感染而死。大約一半的重癥

看護病人有中央動脈導管,而ICU感染是致命

的。于是,他想看看是否有統(tǒng)計數(shù)據(jù)能夠支持

降低感染概率的方法。圖3-10ICU3.1.3醫(yī)療信息數(shù)字化他找到了《急救醫(yī)學》雜志上2004年發(fā)表的一篇文章,文章表明系統(tǒng)地洗手(再配合一套改良的衛(wèi)生清潔程序,比如,用一種叫做雙氯苯雙胍己烷的消毒液清洗病人的皮膚)能夠減少中央動脈導管90%以上感染的風險。博威克預計,如果所有醫(yī)院都實行這套衛(wèi)生程序,就有可能每年挽救25000個人的生命。博威克認為,醫(yī)學護理在很多方面可以學習航空業(yè),現(xiàn)在的飛行員和乘務人員的自由度比以前少得多。他向聯(lián)邦航空局提出,必須在每次航班起飛之前逐字逐句宣讀安全警告。“研究得越多,我就越堅信,醫(yī)生的自由度越少,病人就會越安全,”他說,“聽到我這么說,醫(yī)生會很討厭我?!?.1.3醫(yī)療信息數(shù)字化博威克還制定了一套有力的推廣策略。他不知疲倦地到處奔走,發(fā)表慷慨激昂的演說。他的演講有時聽起來就像是復興大會上的宣講。在一次會議上,他說:“在場的每一個人都將在會議期間挽救5個人的生命?!彼粩嗟赜矛F(xiàn)實世界的例子來解釋自己的觀點,他深深癡迷于數(shù)字。與沒有明確目標的項目不同,他的“10萬生命運動”是全美首個明確在特定時間內挽救特定數(shù)目生命的項目。該運動的口號是:“沒有數(shù)字就沒有時間?!?.1.3醫(yī)療信息數(shù)字化該運動與3000多家醫(yī)院簽訂了協(xié)議,涵蓋全美75%的醫(yī)院床位。大約有1/3的醫(yī)院同意實施全部6項改革,一半以上的醫(yī)院同意實施至少3項改革。該運動實施之前,美國醫(yī)院承認的平均死亡率大約是2.3%。該運動中平均每家醫(yī)院有200個床位,一年大約有10000個床位,這就意味著每年大約有230個病人死亡。從目前的研究推斷,博威克認為參與該運動的醫(yī)院每8個床位就能挽救1個生命?;蛘哒f,200個床位的醫(yī)院每年能夠挽救大約25個病人的生命。參與該運動的醫(yī)院需要在參與之前提供18個月的死亡率數(shù)據(jù),并且每個月都要更新實驗過程中的死亡人數(shù)。很難估計某家有10000個床位的醫(yī)院的病人死亡率下降是否是純粹因為運氣。但是,如果分析3000家醫(yī)院實驗前后的數(shù)據(jù),就可能得到更加準確的估計。3.1.3醫(yī)療信息數(shù)字化實驗結果非常令人振奮。2006年6月14日,博威克宣布該運動的結果已經(jīng)超出了預定目標。在短短18個月里,這6項改革措施使死亡人數(shù)預計減少了122342人。當然,我們不要相信這一確切數(shù)字。部分原因是許多醫(yī)院在一些可以避免的治療失誤問題上取得的進展是獨立的;即使沒有該運動,這些醫(yī)院也有可能會改變他們的工作方式,從而挽救很多生命。無論從哪個角度看,這項運動對于循證醫(yī)學來說都是一次重大勝利??梢钥吹?,“10萬生命運動”的核心就是大數(shù)據(jù)分析。博威克的6項干預并不是來自直覺,而是來自統(tǒng)計分析。博威克觀察數(shù)字,發(fā)現(xiàn)導致人們死亡的真正原因,然后尋求統(tǒng)計上證明能夠有效降低死亡風險的干預措施。超級大數(shù)據(jù)的最佳伙伴——搜索3.1.43.1.4超級大數(shù)據(jù)的最佳伙伴——搜索循證醫(yī)學運動之前的醫(yī)學實踐受到了醫(yī)學研究成果緩慢低效的傳導機制的束縛。據(jù)美國醫(yī)學協(xié)會的估計,“一項經(jīng)過隨機控制試驗產(chǎn)生的新成果應用到醫(yī)療實踐中,平均需要17年,而且這種應用還非常參差不齊?!贬t(yī)學科學的每次進步都伴隨著巨大的麻煩。如果醫(yī)生們沒有在醫(yī)學院或者住院實習期間學會這些東西,似乎永遠也把握不住好機會。3.1.4超級大數(shù)據(jù)的最佳伙伴——搜索如果醫(yī)生不知道有什么樣的統(tǒng)計結果,他就不可能根據(jù)統(tǒng)計結果進行決策。要使統(tǒng)計分析有影響力,就需要有一些能夠將分析結果傳達給決策制定者的傳導機制。大數(shù)據(jù)分析的崛起往往伴隨著并受益于傳播技術的改進,這樣,決策制定者就可以更加迅速地即時獲取并分析數(shù)據(jù)。甚至在互聯(lián)網(wǎng)試驗的應用中,我們也已經(jīng)看過傳導環(huán)節(jié)的自動化。GoogleAdWords功能不僅能夠即時報告測試結果,還可以自動切換到效果最好的那個網(wǎng)頁。大數(shù)據(jù)分析速度越快,就越可能改變決策制定者的選擇。3.1.4超級大數(shù)據(jù)的最佳伙伴——搜索與其他使用大數(shù)據(jù)分析的情況相似,循證醫(yī)學運動也在設法縮短傳播重要研究結果的時間。循證醫(yī)學最核心也最可能受抵制的要求是,提倡醫(yī)生們研究和發(fā)現(xiàn)病人的問題。一直“跟蹤研究”從業(yè)醫(yī)生的學者們發(fā)現(xiàn),新患者所提出的問題大約有2/3會對研究有益。這一比重在新住院的病人中更高。然而被“跟蹤研究”的醫(yī)生卻很少有人愿意花時間去回答這些問題。3.1.4超級大數(shù)據(jù)的最佳伙伴——搜索對于循證醫(yī)學的批評往往集中在信息匱乏上。反對者聲稱,在很多情況下根本不存在能夠為日常治療決策所遇到的大量問題提供指導的高質量的統(tǒng)計研究。抵制循證醫(yī)學的更深層原因其實恰恰相反:對于每個從業(yè)醫(yī)生來說,有太多循證信息了,以至于無法合理地吸收利用。僅以冠心病為例,每年有3600多篇統(tǒng)計方面的論文發(fā)表。這樣,想跟蹤這一領域的學者必須每天(包括周末)讀十幾篇文章。如果讀一篇文章需要15分鐘,那么關于每種疾病的文章每天就要花掉兩個半小時。顯然,要求醫(yī)生投入如此多的時間去仔細查閱海量的統(tǒng)計研究資料,是行不通的。3.1.4超級大數(shù)據(jù)的最佳伙伴——搜索循證醫(yī)學的倡導者們從最開始就意識到信息追索技術的重要性,它使得從業(yè)醫(yī)生可以從數(shù)量巨大且時時變化的醫(yī)學研究資料中提取出高質量的相關信息。網(wǎng)絡的信息提取技術使得醫(yī)生更容易查到特定病人特定問題的相關結果。即使現(xiàn)在高質量的統(tǒng)計研究文獻比以往都多,醫(yī)生在大海里撈針的速度同時也提高了?,F(xiàn)在有眾多計算機輔助搜索引擎,可以使醫(yī)生接觸到相關的統(tǒng)計學研究。3.1.4超級大數(shù)據(jù)的最佳伙伴——搜索對于研究結果的綜述通常帶有鏈接,這樣醫(yī)生在點開鏈接后就可以查看全文以及引用過該研究的所有后續(xù)研究。即使不點開鏈接,僅僅從“證據(jù)質量水平”中,醫(yī)生也可以根據(jù)最初的搜索結果了解到很多?,F(xiàn)在,每項研究都會得到牛津大學循證醫(yī)學中心研發(fā)的15等級分類法中的一個等級,以便使讀者迅速地了解證據(jù)的質量。最高等級(“1a”)只授給那些經(jīng)過多個隨機試驗驗證后都得到相似結果的研究,而最低等級則給那些僅僅根據(jù)專家意見而形成的療法。3.1.4超級大數(shù)據(jù)的最佳伙伴——搜索這種簡潔標注證據(jù)質量的變化很可能成為循證醫(yī)學運動最有影響力的部分?,F(xiàn)在,從業(yè)醫(yī)生評估統(tǒng)計研究提出的政策建議時,可以更好地了解自己能在多大程度上信賴這種建議。最酷的是,大數(shù)據(jù)分析回歸分析不僅可以做預測,而且還可以告訴你預測的精度。證據(jù)質量水平也是如此。循證醫(yī)學不僅提出治療建議,同時還會告訴醫(yī)生支撐這些建議的數(shù)據(jù)質量如何。3.1.4超級大數(shù)據(jù)的最佳伙伴——搜索證據(jù)的評級有力地回應了反對循證醫(yī)學的人,他們認為循證醫(yī)學不會成功,因為沒有足夠的統(tǒng)計研究來回答醫(yī)生所需回答的所有問題。評級使專家們在缺乏權威的統(tǒng)計證據(jù)時仍然能夠回答緊迫的問題。這要求他們顯示出當前知識中的局限。證據(jù)評級標準也很簡單,卻是信息追索方面的重大進步。受到威脅的醫(yī)生們現(xiàn)在可以瀏覽大量網(wǎng)絡搜索的結果,并把道聽途說與經(jīng)過多重檢驗的研究結果區(qū)別開來。3.1.4超級大數(shù)據(jù)的最佳伙伴——搜索互聯(lián)網(wǎng)的開放性甚至改變了醫(yī)學界的文化。回歸分析和隨機試驗的結果都公布出來,不僅僅是醫(yī)生,任何有時間用谷歌搜索幾個關鍵詞的人都可以看到。醫(yī)生越來越感到學習的緊迫性,不是因為(較年輕的)同事們告訴他們要這樣做,而是因為多學習可以使他們比病人懂得更多。正像買車的人在去展廳前會先上網(wǎng)查看一樣,許多病人也會登錄Medline等網(wǎng)站去看看自己可能患上什么樣的疾病。Medline網(wǎng)站最初是供醫(yī)生和研究人員使用的?,F(xiàn)在,1/3以上的瀏覽者是普通老百姓?;ヂ?lián)網(wǎng)不僅僅改變著信息傳導給醫(yī)生的機制,也改變著科技的影響力,即病人影響醫(yī)生的機制。數(shù)據(jù)決策的成功崛起3.1.53.1.5數(shù)據(jù)決策的成功崛起循證醫(yī)學的成功就是數(shù)據(jù)決策的成功,它使決策的制定不僅基于數(shù)據(jù)或個人經(jīng)驗,而且基于系統(tǒng)的統(tǒng)計研究。正是大數(shù)據(jù)分析顛覆了傳統(tǒng)的觀念并發(fā)現(xiàn)受體阻滯劑對心臟病人有效,證明了雌性激素療法不會延緩女性衰老,并導致了“10萬生命運動”的產(chǎn)生。3.1.5數(shù)據(jù)決策的成功崛起1.數(shù)據(jù)輔助診斷迄今為止,醫(yī)學的數(shù)據(jù)決策還主要限于治療問題。幾乎可以肯定的是,下一個高峰會出現(xiàn)在診斷環(huán)節(jié)。我們稱互聯(lián)網(wǎng)為信息的數(shù)據(jù)庫,它已經(jīng)對診斷產(chǎn)生了巨大的影響?!缎掠⒏裉m醫(yī)學期刊》上發(fā)表了一篇文章,講述紐約一家教學醫(yī)院的教學情況?!耙晃换加羞^敏和免疫疾病的人帶著一個得了痢疾的嬰兒,罕見的皮疹(‘鱷魚皮’),多種免疫系統(tǒng)異常,包括T-cell功能低下,(胃黏膜的)組織紅血球以及末梢紅血球,一種顯然與X染色體有關的基因遺傳方式(多個男性親人幼年夭折)?!敝髦吾t(yī)師和其他住院醫(yī)生經(jīng)過長時間討論后,仍然無法得出一致的正確診斷。3.1.5數(shù)據(jù)決策的成功崛起最終,教授問這個病人是否做過診斷,她說她確實做過診斷,而且她的癥狀與一種罕見的名為IPEX的疾病完全吻合。當醫(yī)生們問她怎么得到這個診斷結果時,她回答說:“我在谷歌上輸入我的顯著癥狀,答案馬上就跳出來了。”主治醫(yī)師驚得目瞪口呆?!澳銖墓雀枭纤殉隽嗽\斷結果?……難道不再需要我們醫(yī)生了嗎?”互聯(lián)網(wǎng)使得年輕醫(yī)生不再依賴教授教學作為主要的知識來源。年輕醫(yī)生不必順從德高望重的前人的經(jīng)驗。他們可以利用那些不會給他們帶來煩惱的資源。3.1.5數(shù)據(jù)決策的成功崛起2.你考慮過……了嗎一個名叫“伊沙貝爾”的“診斷-決策支持”軟件項目使醫(yī)生可以在輸入病人的癥狀后就得到一系列最可能的病因。它甚至還可以告訴醫(yī)生病人的癥狀是否是由于過度服用藥物,涉及藥物達4000多種?!耙辽池悹枴睌?shù)據(jù)庫涉及11000多種疾病的大量臨床發(fā)現(xiàn)、實驗室結果、病人的病史,以及其本身的癥狀。“伊沙貝爾”的項目設計人員創(chuàng)立了一套針對所有疾病的分類法,然后通過搜索報刊文章的關鍵詞找出統(tǒng)計上與每個疾病最相關的文章,如此形成一個數(shù)據(jù)庫。這種統(tǒng)計搜索程序顯著地提高了給每個疾病/癥狀匹配編碼的效率。而且如果有新的且高相關性的文章出現(xiàn)時,可以不斷更新數(shù)據(jù)庫。大數(shù)據(jù)分析對于相關性的預測并不是一勞永逸的邏輯搜索,它對“伊沙貝爾”的成功至關重要。3.1.5數(shù)據(jù)決策的成功崛起“伊沙貝爾”項目的產(chǎn)生來自于一個股票經(jīng)紀人被誤診的痛苦經(jīng)歷。1999年,詹森·莫德3歲大的女兒伊沙貝爾被倫敦醫(yī)院住院醫(yī)生誤診為水痘,并遣送回家。只過了一天,她的器官便開始衰竭,該醫(yī)院的主治醫(yī)生約瑟夫?布里托馬上意識到她實際上感染了一種潛在致命性食肉病毒。盡管伊沙貝爾最終康復,但是她父親卻非常后怕,他辭去了金融領域的工作。莫德和布里托一起成立了一家公司,開始開發(fā)“伊沙貝爾”軟件以抗擊誤診。3.1.5數(shù)據(jù)決策的成功崛起研究表明,誤診占所有醫(yī)療事故的1/3。尸體解剖報告也顯示,相當一部分重大疾病是被誤診的?!叭绻纯匆呀?jīng)開出的錯誤診斷記錄,”布里托說,“診斷失誤大約是處方失誤的2倍到3倍?!弊畹凸烙嬘袔装偃f病人被診斷成錯誤的疾病在接受治療。甚至更糟糕的是,2005年刊登在《美國醫(yī)學協(xié)會雜志》上的一篇社論總結道,過去的幾十年間,并未看到誤診率得到了明顯的改善。3.1.5數(shù)據(jù)決策的成功崛起“伊沙貝爾”項目的雄偉目標是改變診斷科學的停滯現(xiàn)狀。莫德簡單地解釋道:“電腦比我們記得更多更好?!笔澜缟嫌?1000多種疾病,而人類的大腦不可能熟練地記住引發(fā)每種疾病的所有癥狀。實際上,“伊沙貝爾”的推廣策略類似用谷歌進行診斷,它可以幫助我們從一個龐大的數(shù)據(jù)庫里搜索并提取信息。誤診最大的原因是武斷。醫(yī)生認為他們已經(jīng)做出了正確的診斷——正如住院醫(yī)生認為伊沙貝爾?莫德得了水痘——因此他們不再思考其他的可能性?!耙辽池悹枴本褪且嵝厌t(yī)生其他可能。它有一頁會向醫(yī)生提問,“你考慮過……了嗎”就是在提醒其他的可能性,這可能會產(chǎn)生深遠的影響。3.1.5數(shù)據(jù)決策的成功崛起2003年,一個來自喬治亞州鄉(xiāng)下的4歲男孩被送入亞特蘭大的一家兒童醫(yī)院。這個男孩已經(jīng)病了好幾個月了,一直高燒不退。血液化驗結果表明這個孩子患有白血病,醫(yī)生決定進行強度較大的化療,并打算第二天就開始實施。約翰·博格薩格是這家醫(yī)院的資深腫瘤專家,他觀察到孩子皮膚上有褐色的斑點,這不怎么符合白血病的典型癥狀。當然,博格薩格仍需要進行大量研究來證實,而且很容易信賴血液化驗的結果,因為化驗結果清楚地表明是白血病?!耙坏┠汩_始用這些臨床方法的一種,就很難再去測量?!辈└袼_格說。3.1.5數(shù)據(jù)決策的成功崛起很巧合的是,博格薩格剛剛看過一篇關于“伊沙貝爾”的文章,并簽約成為軟件測試者之一。因此,博格薩格沒有忙著研究下一個病例,而是坐在電腦前輸入了這個男孩的癥狀??拷澳憧紤]過……了嗎”上面的地方顯示這是一種罕見的白血病,化療不會起作用。博格薩格以前從沒聽說過這種病,但是可以很肯定的是,這種病常常會使皮膚出現(xiàn)褐色斑點。3.1.5數(shù)據(jù)決策的成功崛起研究人員發(fā)現(xiàn),10%的情況下,“伊沙貝爾”能夠幫助醫(yī)生把他們本來沒有考慮的主要診斷考慮進來?!耙辽池悹枴眻猿植恍傅剡M行試驗?!缎掠⒏裉m醫(yī)學期刊》上“伊沙貝爾”的專版每周都有一個診斷難題。簡單地剪切、粘貼病人的病史,輸入到“伊沙貝爾”中,就可以得到10到30個診斷列表。這些列表中75%的情況下涵蓋了經(jīng)過《新英格蘭醫(yī)學期刊》(往往通過尸體解剖)證實為正確的診斷。如果再進一步手動把搜索結果輸入到更精細的對話框中,“伊沙貝爾”的正確率就可以提高到96%?!耙辽池悹枴辈粫暨x出一種診斷結果。“‘伊沙貝爾’不是萬能的。”布里托說。“伊沙貝爾”甚至不能判斷哪種診斷最有可能正確,或者給診斷結果排序。不過,把可能的病因從11000種降低到30種未經(jīng)排序的疾病已經(jīng)是重大的進步了。3.1.5數(shù)據(jù)決策的成功崛起3.大數(shù)據(jù)分析使數(shù)據(jù)決策崛起大數(shù)據(jù)分析將使診斷預測更加準確。目前這些軟件所分析的基本上仍是期刊文章?!耙辽池悹枴钡臄?shù)據(jù)庫有成千上萬的相關癥狀,但是它只不過是每天把醫(yī)學期刊上的文章堆積起來而已。然后一組配有像谷歌這樣的語言引擎輔助的醫(yī)生,搜索與某個癥狀相關的已公布的癥狀,并把結果輸入到診斷結果數(shù)據(jù)庫中。到目前為止,如果你去看病或者住院治療,你看病的結果決不會對集體治療知識有幫助——除非在極個別的情況下,醫(yī)生決定把你的病例寫成文章投到期刊或者你的病例恰好是一項特定研究的一部分。從信息的角度來看,我們當中大部分人都白白死掉了。我們的生或者死對后代起不到任何幫助。3.1.5數(shù)據(jù)決策的成功崛起醫(yī)療記錄的迅速數(shù)字化意味著醫(yī)生們可以利用包含在過去治療經(jīng)歷中豐富的整體信息,這是前所未有的。未來一兩年內,“伊沙貝爾”就能夠針對你的特定癥狀、病史及化驗結果給出患某種疾病的概率,而不僅僅是給出不加區(qū)分的一系列可能的診斷結果。3.1.5數(shù)據(jù)決策的成功崛起有了數(shù)字化醫(yī)療記錄,醫(yī)生們不再需要輸入病人的癥狀并向計算機求助。“伊沙貝爾”可以根據(jù)治療記錄自動提取信息并做出預測。實際上,“伊沙貝爾”近期已經(jīng)與NextGen合作研發(fā)出一種結構靈活的輸入?yún)^(qū)軟件,以抓取最關鍵的信息。在傳統(tǒng)的病歷記錄中,醫(yī)生非系統(tǒng)地記下很多事后看來不太相關的信息,而NextGen系統(tǒng)地收集從頭至尾的信息。從某種意義上來說,這使醫(yī)生不再單純地扮演記錄數(shù)據(jù)的角色。醫(yī)生得到的數(shù)據(jù)就比讓他自己做病歷記錄所能得到的信息要豐富得多,因為醫(yī)生自己記錄得往往很簡單。大數(shù)據(jù)分析這些大量新數(shù)據(jù)能夠使醫(yī)生歷史上第一次有機會即時判斷出流行性疾病。診斷時不應該僅僅根據(jù)專家篩選過的數(shù)據(jù),還根據(jù)使用該醫(yī)療保健體系的數(shù)百萬民眾的看病經(jīng)歷,數(shù)據(jù)分析最終的確可以更好地決定如何診斷。3.1.5數(shù)據(jù)決策的成功崛起大數(shù)據(jù)分析使數(shù)據(jù)決策崛起。它讓你在回歸方程的統(tǒng)計預測和隨機試驗的指導下進行決策——這是循證醫(yī)學真正想要的。大多數(shù)醫(yī)生(正如我們已經(jīng)看過和即將看到的其他決策者一樣)仍然固守成見,認為診斷是一門經(jīng)驗和直覺最為重要的藝術。但對于大數(shù)據(jù)天才來說,診斷只不過是另一種預測而已?!咀鳂I(yè)】討論:【實訓操作】ETI公司的背景信息討論:目錄1任務3.1:理解大數(shù)據(jù)促進醫(yī)療與健康2任務3.2:理解大數(shù)據(jù)激發(fā)創(chuàng)造力【導讀案例】臉書的設計決策討論:(1)你怎么理解“大多數(shù)情況下,當臉書改變其設計決策時,用戶一般都不會接受這種改變。事實上,他們還會討厭這種改變”?你還能舉出類似這樣的例子嗎?(考慮QQ、微信、網(wǎng)游、手游的發(fā)展)(2)哪6種因素會影響到臉書的產(chǎn)品設計決策?(3)“真正的創(chuàng)新通常會導致數(shù)據(jù)變差”,那

為什么還要創(chuàng)新設計?(4)請簡單記述你所知道的上一周內發(fā)生的國

際、國內或者身邊的大事?!救蝿彰枋觥浚?)熟悉大數(shù)據(jù)改善設計的主要途徑和方法;(2)了解大數(shù)據(jù)催生嶄新應用程序所帶來的市場與商機;(3)熟悉大數(shù)據(jù)操作回路和反饋回路的概念,掌握數(shù)據(jù)驅動的設計方法?!局R準備】大數(shù)據(jù)激發(fā)創(chuàng)造力通常,設計師往往認為創(chuàng)造力與數(shù)據(jù)格格不入,甚至會阻礙創(chuàng)造力的發(fā)展。但實際情況是,數(shù)據(jù)在確定設計改變是否可以幫助更多的人完成他們的任務或實現(xiàn)更高的轉換方面,可謂大有裨益。數(shù)據(jù)可以幫助改善現(xiàn)有的設計,但并不能為設計者提供一種全新的設計;它可以改善網(wǎng)站,但它不能從無到有地創(chuàng)造出一個全新的網(wǎng)站。換句話說,在提到設計時,數(shù)據(jù)可能會有助于實現(xiàn)局部最大化,而不是全局最大化。當設計無法正常運作時,數(shù)據(jù)也會向你做出提醒。大數(shù)據(jù)幫助改善設計3.2.13.2.1大數(shù)據(jù)幫助改善設計不管是游戲、汽車還是建筑物,這些不同領域的設計有一個共同的特點,就是其設計過程在不斷變化。從設計到最終對進行測試,這一過程會隨著大數(shù)據(jù)的使用而逐漸縮短。從現(xiàn)有的設計中獲取數(shù)據(jù),并搞清楚問題所在,或弄懂如何大幅度改善的過程也在逐漸加快。低成本的數(shù)據(jù)采集和計算機資源,在加快設計、測試和重新設計這一過程中發(fā)揮了很大的作用。反過來說,不僅人們自己研發(fā)的設計能夠接受到啟示,設計程序本身也會如此。3.2.1大數(shù)據(jù)幫助改善設計1.與玩家共同設計游戲大數(shù)據(jù)在高科技的游戲設計領域中也發(fā)揮著至關重要的作用。通過分析,游戲設計者可以對新保留率和商業(yè)化機會進行評估,即使是在現(xiàn)有的游戲基礎之上,也能為用戶提供令人更加滿意的游戲體驗。通過對游戲費用等指標的分析,游戲設計師們能吸引游戲玩家,提高保留率、每日活躍用戶和每月活躍用戶數(shù)、每個游戲玩家支付的費用以及游戲玩家每次玩游戲花費的時間。Kontagent公司為收集這類數(shù)據(jù)提供輔助工具,該公司曾與成千上萬的游戲工作室合作過,以幫助他們測試和改進他們發(fā)明的游戲。游戲公司通過定制的組件來發(fā)明游戲。3.2.1大數(shù)據(jù)幫助改善設計他們采用的是內容管道方法(ContentPipelire),其中的游戲引擎可以導入游戲要素,這些要素包括圖形、級別、目標和挑戰(zhàn),以供游戲玩家攻克。這種管道方法意味著,游戲公司會區(qū)分不同種類的工作,比如對軟件工程師的工作和圖形藝術家及級別設計師的工作進行區(qū)分。通過設置更多的關卡,游戲設計者更容易對現(xiàn)有的游戲進行拓展,而無須重新編寫整個游戲。相反,設計師和圖形藝術家只需創(chuàng)建新級別的腳本、添加新挑戰(zhàn)、創(chuàng)造新圖形和元素。這也就意味著,不僅游戲設計者可以添加新級別,游戲玩家也可以這么做,或者至少可以設計新圖形。3.2.1大數(shù)據(jù)幫助改善設計游戲設計者斯科特·休梅克還表明,利用數(shù)據(jù)驅動來設計游戲,可以減少游戲創(chuàng)造過程中的相關風險。不僅是因為許多游戲很難通關成功,而且,就財務方面而言,通關成功的游戲往往并不成功。正如休梅克曾指出的,好的游戲不僅關乎良好的圖形和級別設計,還與游戲的趣味性和吸引力有關。在游戲發(fā)行之前,游戲設計師很難對這些因素進行正確的評估,所以游戲設計的推行、測試和調整至關重要。通過將游戲數(shù)據(jù)和游戲引擎進行區(qū)分,很容易對這些游戲元素進行調整,如《吃豆人》游戲中小精靈吃豆的速度。3.2.1大數(shù)據(jù)幫助改善設計2.以人為本的汽車設計理念福特汽車的首席大數(shù)據(jù)分析師約翰·金德認為,汽車企業(yè)坐擁海量的數(shù)據(jù)信息,“消費者、大眾及福特自身都能受益匪淺?!?006年左右,隨著金融危機的爆發(fā)以及新任首席執(zhí)行官的就職,福特公司開始更加樂于接受基于數(shù)據(jù)得出的決策,而不再單純憑直覺做出決策,公司在數(shù)據(jù)分析和模擬的基礎上提出了更多新的方法。3.2.1大數(shù)據(jù)幫助改善設計福特公司的不同職能部門都會配備數(shù)據(jù)分析小組,如信貸部門的風險分析小組、市場營銷分析小組、研發(fā)部門的汽車研究分析小組。數(shù)據(jù)在公司發(fā)揮了重大作用,因為數(shù)據(jù)和數(shù)據(jù)分析不僅可以解決個別戰(zhàn)術問題,而且對公司持續(xù)戰(zhàn)略的制訂來說也是一筆重要的資產(chǎn)。公司強調數(shù)據(jù)驅動文化的重要性,這種自上而下的度量重點對公司的數(shù)據(jù)使用和周轉產(chǎn)生了巨大的影響。3.2.1大數(shù)據(jù)幫助改善設計福特還在硅谷建立了一個實驗室,以幫助公司發(fā)展科技創(chuàng)新。公司獲取的數(shù)據(jù)主要來自于大約400萬輛配備有車載傳感設備的汽車。通過對這些數(shù)據(jù)進行分析,工程師能夠了解人們駕駛汽車的情況、汽車駕駛環(huán)境及車輛響應情況。所有這些數(shù)據(jù)都能幫助改善車輛的操作性、燃油的經(jīng)濟性和車輛的排氣質量。利用這些數(shù)據(jù),公司對汽車的設計進行改良,降低車內噪聲,還能確定揚聲器的最佳位置,以便接收語音指示。3.2.1大數(shù)據(jù)幫助改善設計設計師還能利用數(shù)據(jù)分析做出決策,如賽車改良決策和影響消費者購買汽車的決策。舉例來說,潘世奇車隊設計的賽車不斷在比賽中失利。為了弄清失利的原因,工程師為該車隊的賽車配備了傳感器,這種傳感器能收集到20多種不同變量的數(shù)據(jù),如輪胎溫度和轉向等。雖然工程師已對這些數(shù)據(jù)進行了兩年的分析,他們仍然無法弄清楚賽車手在比賽中失利的原因。而數(shù)據(jù)分析型公司EventHorizon也收集了同樣的數(shù)據(jù),但其對數(shù)據(jù)的處理方式完全不同。該公司沒有從原始數(shù)字入手,而是通過可視化模擬來重視賽車改裝后在比賽中的情況。通過可視化模擬,他們很快就了解到,賽車手轉動方向盤和賽車啟動之間存在一段滯后時間。賽車手在這段時間內會做出很多微小的調整,所有這些微小的調整加起來就占據(jù)了不少時間。3.2.1大數(shù)據(jù)幫助改善設計由此可以看出,僅僅擁有真實的數(shù)據(jù)是遠遠不夠的。就大數(shù)據(jù)的設計和其他方面而言,能夠以正確的方式觀察數(shù)據(jù)才是至關重要的。3.2.1大數(shù)據(jù)幫助改善設計3.尋找最佳音響效果大數(shù)據(jù)還能幫助我們設計更好的音樂廳。在20世紀末,哈佛大學的講師W.C.薩賓開創(chuàng)了建筑聲學這一新領域。研究之初,薩賓將福格演講廳(聽眾認為其聲學效果不明顯)和附近的桑德斯劇院(聲學效果顯著)進行了對比。在助手的協(xié)助下,薩賓將坐墊之類的物品從桑德斯劇院移到了福格演講廳,以判斷這類物品對音樂廳的聲學效果會產(chǎn)生怎樣的影響。薩賓和他的助手在夜間開始工作,經(jīng)過仔細測量后,他們會在早晨到來之前將所有物品放回原位,從而不影響兩個音樂廳的日間運作。3.2.1大數(shù)據(jù)幫助改善設計經(jīng)過大量的研究,薩賓對混響時間(或稱“回聲效應”)做出了這樣一個定義:它是聲音從其原始水平下降60分貝所需的秒數(shù)。薩賓發(fā)現(xiàn),聲學效果最好的音樂廳的混響時間為2~2.25秒。混響時間太長的音樂廳會被認為過于“活躍”,而混響時間太短的音樂廳會被認為過于“平淡”?;祉憰r間的長短主要取決于兩個因素:房間的容積和總吸收面積或現(xiàn)有吸收面積。在福格演講廳中,所聽到的說話聲大約能延長5.5秒,薩賓減少了其回音效果并改善了它的聲學效果。后來,薩賓還參與了波士頓音樂廳(見圖3-12)的設計。3.2.1大數(shù)據(jù)幫助改善設計圖3-12波士頓音樂廳3.2.1大數(shù)據(jù)幫助改善設計繼薩賓之后,該領域開始呈現(xiàn)出蓬勃的發(fā)展趨勢。如今,借助模型,數(shù)據(jù)分析師不僅對現(xiàn)有音樂廳的聲學問題進行評估,還能模擬新音樂廳的設計。同時,還能對具有可重新配置幾何形狀及材料的音樂廳進行調整,以滿足音樂或演講等不同的用途,這就是其創(chuàng)新所在。3.2.1大數(shù)據(jù)幫助改善設計具有諷刺意味的是,許多建于19世紀后期的古典音樂廳的音響效果可謂完美,而那些近期建造的音樂廳則達不到這種效果。這主要是因為如今的音樂廳渴望容納更多的席位,同時還引進了許多新型建材以使建筑師設計出幾乎任何形狀和大小的音樂廳,而不再受限于木材的強度和硬度?,F(xiàn)在建筑師正試圖設計新的音樂廳,以期能與波士頓和維也納音樂殿堂的音響效果匹敵。音質、音樂廳容量和音樂廳的形狀可能會出現(xiàn)沖突。而通過利用大數(shù)據(jù),建筑師可能會設計出跟以前類似的音響效果,同時還能使用現(xiàn)代化的建筑材料來滿足當今的座席要求。3.2.1大數(shù)據(jù)幫助改善設計4.建筑,數(shù)據(jù)取代直覺建筑師還在不斷將數(shù)據(jù)驅動型設計推廣至更廣泛的領域。正如LMN建筑事務所的薩姆·米勒指出的,老建筑的設計周期是:設計、記錄、構建和重復。只有經(jīng)過多年的實踐,你才能完全領會這一過程,一個擁有20多年設計經(jīng)驗的建筑師或許只見證過十幾個這樣的設計周期。隨著數(shù)據(jù)驅動型架構的實現(xiàn),建筑師已經(jīng)可以用一種迭代循環(huán)過程來取代上述過程了,該迭代循環(huán)過程即模型、模擬、分析、綜合、優(yōu)化和重復。就像發(fā)動機設計人員可以使用模型來模擬發(fā)動機的性能一樣,建筑師如今也可以使用模型來模擬建筑物的結構。3.2.1大數(shù)據(jù)幫助改善設計據(jù)米勒講,其設計組如今只需短短幾天的時間就可以模擬成百上千種設計,他們還可以找出哪些因素會對設計產(chǎn)生最大的影響。米勒說:“直覺在數(shù)據(jù)驅動型設計程序中發(fā)揮的作用在逐漸減少?!倍医ㄖ锏男阅芤恿己谩=ㄖ煵⒉荒鼙WC研究和設計會花費多少時間,但米勒說,數(shù)據(jù)驅動型方法使這種投資變得更加有意義,因為它保證了公司的競爭優(yōu)勢。通過將數(shù)據(jù)應用于節(jié)能和節(jié)水的實踐中,大數(shù)據(jù)也有助于綠色建筑的設計。通過評估基準數(shù)據(jù),建筑師如今可以來判斷出某個特定的建筑物與其他綠色建筑的區(qū)別所在。美國環(huán)保署(EPA)的在線工具“投資組合經(jīng)理”就應用了這一方法。它的主要功能是互動能源管理,它可以讓業(yè)主、管理者和投資者對所有建筑物耗費的能源和用水進行跟蹤和評估。3.2.1大數(shù)據(jù)幫助改善設計Safaira公司還設計了一種基于Web的軟件,軟件利用專業(yè)物理知識,能夠提供設計分析、知識管理和決策支持。有了這種軟件,用戶就可以對不同戰(zhàn)略設計中的能源、水、碳和經(jīng)濟利益進行測量和優(yōu)化。大數(shù)據(jù)操作回路3.2.23.2.2大數(shù)據(jù)操作回路幾十年來,理解數(shù)據(jù)是數(shù)據(jù)分析師、統(tǒng)計學家們的事情。業(yè)務經(jīng)理要想提取數(shù)據(jù),不僅要等IT部門收集到主要數(shù)據(jù),還要等分析師們將數(shù)據(jù)匯聚并分析理解之后才能處理。大數(shù)據(jù)應用程序的前景不僅是收集數(shù)據(jù)的能力,還有利用數(shù)據(jù)的能力,而且對數(shù)據(jù)的利用不需要采用只有統(tǒng)計學家們才會使用的一系列工具。通過讓數(shù)據(jù)變得更易獲取,大數(shù)據(jù)應用程序將使組織機構一個產(chǎn)品線、一個產(chǎn)品線地變得更依賴于數(shù)據(jù)驅動。不過,即使我們有了數(shù)據(jù)和利用數(shù)據(jù)所需的相關工具,要做到數(shù)據(jù)化還是有相應的難度的。3.2.2大數(shù)據(jù)操作回路數(shù)據(jù)驅動要求我們不僅要掌握數(shù)據(jù),挑出數(shù)據(jù),還必須基于相關數(shù)據(jù)來制訂決策。這樣的話,我們既要有信心,即相信數(shù)據(jù);也要有足夠的信念,即使大眾的意見與之相左,也要基于數(shù)據(jù)來進行決策。我們將其稱為大數(shù)據(jù)操作回路。圖3-13大數(shù)據(jù)操作回路3.2.2大數(shù)據(jù)操作回路1.信號與噪聲從歷史的角度看,獲取和處理數(shù)據(jù)都很麻煩,因為通常數(shù)據(jù)并不集中在一個地方。公司內部數(shù)據(jù)分布在一系列不同的數(shù)據(jù)庫、數(shù)據(jù)存儲器和文件服務器之中,而外部數(shù)據(jù)則分布在市場報告、網(wǎng)絡以及其他難以獲取數(shù)據(jù)的地方。大數(shù)據(jù)的挑戰(zhàn)和優(yōu)勢就在于,它通常會將所有數(shù)據(jù)集中到一個地方,這就意味著有可能通過處理更多相關數(shù)據(jù),得到更豐富的內涵——工程師們將這些數(shù)據(jù)稱為信號,當然,這也意味著有更多的噪聲——與結論不相關的數(shù)據(jù)和甚至會導致錯誤結論的數(shù)據(jù)。3.2.2大數(shù)據(jù)操作回路如果計算機或人不能理解數(shù)據(jù),那么僅僅將數(shù)據(jù)集中到一塊也起不了什么作用。大數(shù)據(jù)應用程序有助于從噪聲中提取信號,以加強我們對數(shù)據(jù)的信心,提升基于數(shù)據(jù)進行決策的信念。3.2.2大數(shù)據(jù)操作回路2.大數(shù)據(jù)反饋回路在你第一次摸到滾燙的火爐的時候,第一次把手伸進電源盒的時候,或者第一次超速行駛的時候,你會經(jīng)歷一次反饋回路。不管你是否意識到,你都會進行測算并分析其結果,這個結果會影響你未來的行為。我們把這稱之為“大數(shù)據(jù)反饋回路”,而這也是成功的大數(shù)

據(jù)應用程序的核心所在。圖3-14大數(shù)據(jù)反饋回路3.2.2大數(shù)據(jù)操作回路通過測算,你會發(fā)現(xiàn)摸滾燙的火爐或者被電擊會讓你感到疼痛,超速行駛會給你招來昂貴的罰單或者車禍。不過,你要是僥幸逃過了這些,你可能會覺得超速行駛很爽。3.2.2大數(shù)據(jù)操作回路不管結果如何,所有的行為都會給你反饋。你會把這些反饋融入到你的個人數(shù)據(jù)圖書館中,然后根據(jù)這些數(shù)據(jù),改變你未來的行為方式。你要是有過那么一次很爽的超速行駛的經(jīng)歷,在未來,你可能會更多地選擇超速行駛。如果你有過被火爐燙到的不爽的經(jīng)歷,你可能以后在摸火爐之前會先確認它是否燙手。當涉及大數(shù)據(jù)的時候,這種反饋回路至關重要。單純動手收集和分析數(shù)據(jù)并不夠,你還必須有從數(shù)據(jù)中得出一系列結論的能力以及對這些結論的反饋,以確認這些結論的正誤。你的模型融入的數(shù)據(jù)越相關,你越能得到更多關于你的假設的反饋,因而你的見解也就越有價值。3.2.2大數(shù)據(jù)操作回路過去運行這種反饋回路速度慢、時間長。比方說,我們收集銷售數(shù)據(jù),然后試圖總結出能促進消費者購買的定價機制或產(chǎn)品特征。我們調整價格、改變產(chǎn)品特征并再次進行試驗。問題就在于,當我們總結出分析結果,并調整了價格和產(chǎn)品的時候,情況又發(fā)生了變化。3.2.2大數(shù)據(jù)操作回路大數(shù)據(jù)的好處在于,我們如今能夠以更快的速度運行這種反饋回路。比方說,廣告界的大數(shù)據(jù)應用程序需要通過提供多種多樣的廣告才能夠得知哪個廣告最奏效,這甚至能在細分基礎上得以實現(xiàn)——他們能判斷出哪個廣告對哪種人群最奏效。人們沒法做這種A或B的測算——展示不同的廣告來知道哪個更好,或哪個見效更快。但是計算機能大量地進行這種測算,不僅在不同的廣告中間進行選擇,實際

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論