用戶行為數(shù)據(jù)收集和分析方法_第1頁
用戶行為數(shù)據(jù)收集和分析方法_第2頁
用戶行為數(shù)據(jù)收集和分析方法_第3頁
用戶行為數(shù)據(jù)收集和分析方法_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、網(wǎng)站用戶行為數(shù)據(jù)收集和分析方法網(wǎng)站用戶行為數(shù)據(jù)收集和分析方法為改善網(wǎng)站的可用性, 一般采用可用性工程方法, 其核心是以用戶為中心的設計方法論(UCD)。綜合介紹了目前國內(nèi)外對于用戶行為數(shù)據(jù)收集和分析方法所進行的研究, 各種方法的特點, 并介紹一些利用相應方法所開發(fā)出的工具實例, 使得建設的網(wǎng)站更加符合用戶的需要, 以保障用戶與網(wǎng)站之間溝通的順暢。隨著In ternet 的不斷發(fā)展, 各種各樣的網(wǎng)站如雨后春筍般成倍增長, 各個商業(yè)網(wǎng)站之間的競爭越來越激烈, 隨之而來的是, 網(wǎng)站的建設不可避免的出現(xiàn)了很多問題。從最近一次國外對15 個大型網(wǎng)站進行統(tǒng)計分析表明, 用戶在尋找自己所需要的信息時, 只有

2、42% 的概率可以找到, 而在大部分的時間里用戶都無法找到自己所需要的信息, 這使得用戶在瀏覽網(wǎng)站時經(jīng)常遭遇挫折, 嚴重影響了用戶對網(wǎng)站的興趣和信任。正如 J acob N ielsen 所指出的"如果你想通過網(wǎng)站找到某些信息, 那么在一般情況下很難找到, 就算能夠找到, 也要經(jīng)過一番周折。從以往的經(jīng)驗可以得知, 除非項目管理團隊在整個網(wǎng)站設計過程中就特別考慮網(wǎng)站的可用性, 否則結果往往令人失望"。針對網(wǎng)站的特點, 目前國內(nèi)外提出了很多依靠計算機輔助來自動收集和分析用戶行為數(shù)據(jù)的方法, 本文以下部分將重點介紹基于服務器日志收集和分析用戶行為數(shù)據(jù)的方法和從客戶端收集和分析用戶

3、行為數(shù)據(jù)的方法, 并對根據(jù)不同的方法所開發(fā)出的一些工具進行了介紹。1 基于服務器日志收集和分析用戶行為數(shù)據(jù)的方法目前, 對于網(wǎng)站來說, 自動獲得用戶行為數(shù)據(jù)最流行的方法之一是基于服務器日志的方法(Server log) ,就是通過從w eb 服務器所產(chǎn)生的日志文件來獲取有用的數(shù)據(jù)。服務器日志文件就是用來記錄w eb 服務器的活動, 提供了詳細的客戶和服務器的交互活動日志, 其中包括客戶的請求和服務器的響應。通過日志文件收集到的數(shù)據(jù)形式依賴于具體的w eb 服務器類型, 不同的w eb 服務器產(chǎn)生的信息是不一樣的。1. 1 基于服務器日志方法的優(yōu)點通過日志文件可以獲得很有價值的網(wǎng)站使用情況的數(shù)據(jù)

4、。 日志文件是由w eb 服務器自動生成, 所以花費比較小。 與人為建造的可用性實驗室環(huán)境相比, 通過日志文件獲得的數(shù)據(jù)更能夠反映真實環(huán)境下用戶的真實情況。 與只對幾個用戶在幾小時內(nèi)進行的測試所獲得的數(shù)據(jù)相比, 通過日志文件獲得的是大量的用戶在相當長一段時間內(nèi)的行為數(shù)據(jù), 這對分析用戶的行為是十分有利的, 可以利用數(shù)據(jù)挖掘等技術對用戶進行分析。 開發(fā)基于日志文件的數(shù)據(jù)分析工具相對比較容易, 花費也不是太大。1. 2 基于服務器日志方法的缺點基于日志的方法對于網(wǎng)站的可用性研究來說還存在著很多不足之處, 由于日志文件就是被設計用來產(chǎn)生站點級的性能統(tǒng)計數(shù)據(jù), 因此不可避免的是, 日志文件所提供的數(shù)據(jù)

5、與用來分析網(wǎng)站可用性所需的大量數(shù)據(jù)相比會有所不足, 對于研究潛在的可用性問題只能提供少量的數(shù)據(jù)甚至還可能提供一些誤導性的數(shù)據(jù)。這是因為一旦w eb 服務器把用戶請求的頁面發(fā)送出去之后, 如果用戶不發(fā)出請求, 則頁面和用戶之間發(fā)生了什么w eb 服務器并不記錄。下面是一些從日志文件中獲取的數(shù)據(jù)不足或有誤導性數(shù)據(jù)的例子。 誰正在訪問網(wǎng)站。如果想知道誰正在訪問網(wǎng)站, 要求日志文件必須包含一個個人ID 或者登錄到服務器的登錄標示, 但是目前的網(wǎng)站一般不需要用戶登錄, 大多情況下由日志文件提供的客戶端信息是客戶的IP 地址, 而這些IP 地址很多情況下是由In ternet 提供商提供的動態(tài)IP。并且有

6、時用通過代理服務器來訪問In ternet (例如, 學校的校園網(wǎng)) , 這樣就不能正確得知是哪個用戶在訪問網(wǎng)站。 用戶訪問網(wǎng)站的路徑。如果日志文件能夠記下用戶所瀏覽的每個頁面, 那么自然可以清楚的記錄用戶的訪問路徑, 然而, 當把用戶的瀏覽器設置為可使用緩存(cache) 時(通常是缺省設置) , 用戶所瀏覽的一些頁面就不能被w eb 服務器所記錄, 例如, 使用Back 按鈕瀏覽的頁面就不能被記錄。而且, 如果同一頁面中提供了多個選擇可鏈接到同一個頁面的話, 用戶到底是使用哪一個鏈接過去, 這一信息從log 文件中也難以獲得, 但是這一信息對改善網(wǎng)站的可用性也是很重要的。如果是通過圖片鏈接

7、,w eb 服務器可能會記下用戶單擊的坐標位置, 從而可以獲得用戶的確切信息, 如果沒有使用這種技術的話, 就很難捕獲這一信息。而且, 當用戶通過鍵入U RL 地址, 或通過書簽來訪問頁面時,w eb 服務器也不能記錄這一信息。 用戶在每頁的停留時間。日志文件記錄的是數(shù)據(jù)開始傳輸?shù)臅r間, 而不是傳輸完成的時間。而且也不清楚, 在頁面下載的過程中, 用戶到底在什么時間開始瀏覽頁面。除非在頁面顯示的時候, 用戶因有事離開了, 不然可以通過比較用戶的當前請求和下一次請求之間的時間來粗略計算用戶在此頁面停留的大概時間 (通過后一次的請求時間減去第一次的請求時間得到, 但對于從cache 中獲取的頁面來

8、說就出現(xiàn)很大偏差)。 用戶離開站點的位置。日志文件記錄了在用戶會話期間所發(fā)送的最后一頁, 但是這可能并不是用戶所看到的最后一頁。其中有兩個原因: 第一, 用戶所看到的最后一頁可能是從cache 中得到。第二, 用戶可能已經(jīng)有事離開了很長時間, 而這段時間已經(jīng)超過了 w eb 服務器所定義的用戶會話時間。 用戶是否成功完成自己想要做的事情。這是最根本的可用性問題, 只是通過單獨的日志文件統(tǒng)計是很難回答的, 如果是"用戶是否完成了交易? 用戶是否成功地下載了文件?"之類的問題, 答案還是很容易推斷。然而, 如果要回答"用戶是否找到了所需要的信息?"類似這樣的

9、問題, 僅通過日志文件就很難回答了。1. 3基于服務器日志文件方法獲取數(shù)據(jù)的輔助工具 Click T races A nalyzer 是分析網(wǎng)站用戶行為的一套工具, 為進一步了解用戶的瀏覽行為提供了強大的功能, 它把大量的復雜數(shù)據(jù)用非常簡單的方法表達出來, 使可用性人員在分析用戶行為時一目了然。2客戶端收集和分析用戶行為數(shù)據(jù)的方法由于通過日志文件獲得的信息會出現(xiàn)失真的情況, 而且有很多重要的數(shù)據(jù)只通過日志文件很難獲得, 這些信息對研究網(wǎng)站的可用性問題卻很重要, 因此為了進一步獲得更多的有價值的可用性數(shù)據(jù), 發(fā)現(xiàn)更多的網(wǎng)站可用性問題, 逐漸產(chǎn)生了很多技術用于從客戶端(page- side) 直接

10、獲得用戶與網(wǎng)站的交互情況。由于是直接從客戶端獲得數(shù)據(jù), 所以, 能夠獲得大量的難以從服務器端獲得的用戶行為數(shù)據(jù), 這對進一步分析用戶瀏覽網(wǎng)站行為, 改善潛在的網(wǎng)站可用性問題提供了更大的幫助。2. 1客戶端收集用戶行為數(shù)據(jù)的優(yōu)點 由于用戶是在真實的環(huán)境下所進行的操作(如在家里或辦公室) , 減少了人為地干擾因素, 因此獲得的數(shù)據(jù)更加真實。 與基于日志文件的方法相比, 從客戶端收集到的數(shù)據(jù)更加精確, 能夠克服如上描述的很多問題。 不受動態(tài)分配IP 地址或代理服務器的影響: 通過使用客戶端跟蹤技術(如由w eb 服務器對每個訪問站點的客戶機自動分配ID 并將其記錄在客戶端的 Cook ies 中,

11、每次用戶瀏覽網(wǎng)站,w eb 服務器可通過訪問客戶端的Cook ies 就知道此客戶機是否訪問過本網(wǎng)站)。正確的用戶瀏覽路徑: 由于是在客戶端記錄用戶行為, 因此客戶端代碼可自動跟蹤用戶的瀏覽路徑, 不管是否通過本機緩存或通過代理服務器。例如, 用戶的實際瀏覽路徑是從A B, 點擊Back 鈕, A C, 但是從log 文件中得到的路徑是A B C。頁面瀏覽時間: 舉例如圖1 (頁面是由cgi 腳本產(chǎn)生的動態(tài)文件)。這是使用Click st ream 收集工具與基于服務器的日志文件產(chǎn)生的數(shù)據(jù)比較, 日志文件丟失了很多重要數(shù)據(jù)。什么是用戶行為分析,以及價值標準?最初發(fā)表于:2011-2-27 10

12、:53:32 您是第 364 人次瀏覽本文什么是用戶行為分析,以及價值標準?用戶行為研究主要的工作就是研究用戶的行為,通過對用戶行為的研究來更好的了用戶、了解需求。 在互聯(lián)網(wǎng)產(chǎn)品中,用戶訪問我們的網(wǎng)站,我們來設計我們的網(wǎng)站。一個關鍵的問題是,我們?nèi)绾文軌蛄私馕覀兊挠脩簦麄兪钦l,有著怎樣的習慣和偏好。幸運的是,用戶在訪問我們網(wǎng)站的時候會留下一些痕跡,他們的訪問記錄,我們可以通過對這些記錄進行挖掘,分析他們在我們網(wǎng)站上的行為,來了解用戶的習慣和屬性。然后我們就可以來改進我們的網(wǎng)頁,可以優(yōu)化我們的頁面設計,也可以優(yōu)化我們的產(chǎn)品,有針對性的向用戶推介一些信息。所以說用戶行為研究的核心內(nèi)容就是用戶行為

13、分析。什么是用戶行為分析,以及價值標準?用戶行為分析,是指在獲得網(wǎng)站訪問量基本數(shù)據(jù)的情況下,對有關數(shù)據(jù)進行統(tǒng)計、分析,從中發(fā)現(xiàn)用戶訪問網(wǎng)站的規(guī)律,并將這些規(guī)律與網(wǎng)絡營銷策略等相結合,從而發(fā)現(xiàn)目前網(wǎng)絡營銷活動中可能存在的問題,并為進一步修正或重新制定網(wǎng)絡營銷策略提供依據(jù)。用戶行為分析應該包含以下重點分析數(shù)據(jù):用戶在網(wǎng)站的停留時間、跳出率、回訪者、新訪問者、回訪次數(shù)、回訪相隔天數(shù);注冊用戶和非注冊用戶,分析兩者之間的瀏覽習慣;用戶所使用的搜索引擎、關鍵詞、關聯(lián)關鍵詞和站內(nèi)關鍵字;用戶選擇什么樣的入口形式(廣告或者網(wǎng)站入口鏈接)更為有效;用戶訪問網(wǎng)站流程,用來分析頁面結構設計是否合理;用戶在頁面的上的網(wǎng)頁熱點圖分布數(shù)據(jù)和網(wǎng)頁覆蓋圖數(shù)據(jù);用戶在不同時段的訪問量情況等。這是一種

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論