文獻(xiàn)標(biāo)識(shí)碼: A
文章編號(hào): 0258-7998(2013)04-0124-02
在信息社會(huì)中,為各類用戶提供海量信息網(wǎng)站的建設(shè)飛速發(fā)展,其中包含的信息隨之成倍增長,在為用戶帶來便利的同時(shí),能否以較短的時(shí)間盡可能多地獲取用戶需要的信息,成為評(píng)價(jià)一個(gè)網(wǎng)站的重要標(biāo)準(zhǔn)。綜觀現(xiàn)有網(wǎng)站的評(píng)價(jià)標(biāo)準(zhǔn),主觀因素主導(dǎo)著標(biāo)準(zhǔn),客觀的量化標(biāo)準(zhǔn)也仍是以主觀評(píng)價(jià)為前提,有的僅僅計(jì)算了主觀因素的權(quán)重。本文在考慮用戶體驗(yàn)的情況下,綜合以往網(wǎng)站評(píng)價(jià)的相關(guān)研究,基于用戶分組,提出了一種新的網(wǎng)站評(píng)價(jià)的量化標(biāo)準(zhǔn)。
1 用戶瀏覽網(wǎng)站的數(shù)學(xué)模型
1.1 用戶瀏覽網(wǎng)站的馬氏鏈排隊(duì)模型
用戶瀏覽網(wǎng)頁內(nèi)容是網(wǎng)站對(duì)于用戶的一次服務(wù),每一個(gè)網(wǎng)頁即是一個(gè)服務(wù)窗,用戶搜尋下一個(gè)點(diǎn)擊目標(biāo)即是等待服務(wù)的過程。由此,用戶瀏覽網(wǎng)站即可用一個(gè)排隊(duì)模型來表述[1]。假定網(wǎng)站共有n個(gè)網(wǎng)頁,則用戶對(duì)網(wǎng)頁瀏覽的抽象排隊(duì)模型的狀態(tài)流圖如圖1所示。

其中,k表示用戶從進(jìn)入網(wǎng)站開始瀏覽了k個(gè)網(wǎng)頁,0≤k≤n;0表示正在瀏覽第一個(gè)網(wǎng)頁或者離開系統(tǒng)。由k到0 的狀態(tài)表示用戶瀏覽k個(gè)網(wǎng)頁后離開系統(tǒng)。


其中,n為網(wǎng)站的網(wǎng)頁總數(shù)。此式求出用戶組在網(wǎng)站中停留的時(shí)間,這個(gè)時(shí)間參量對(duì)于衡量該用戶組瀏覽網(wǎng)站的效率具有重要的參考價(jià)值。
2 基于用戶分組的網(wǎng)站評(píng)價(jià)量化標(biāo)準(zhǔn)
根據(jù)1.2節(jié)的計(jì)算得到某一用戶組在網(wǎng)站中停留的時(shí)間,包括閱讀時(shí)間和搜索時(shí)間。閱讀時(shí)間由用戶閱讀速度和網(wǎng)頁內(nèi)容決定。在用戶閱讀速度一定的情況下,用戶是否對(duì)網(wǎng)頁內(nèi)容感興趣是閱讀時(shí)間的決定因素;搜索時(shí)間則由網(wǎng)站的導(dǎo)航結(jié)構(gòu)及信息推送決定。因此用戶瀏覽網(wǎng)站的時(shí)間可以作為網(wǎng)頁內(nèi)容是否具有可讀性、網(wǎng)站結(jié)構(gòu)是否合理、信息推送是否準(zhǔn)確及時(shí),以及運(yùn)行機(jī)制是否高效的標(biāo)準(zhǔn)之一。從信息量的角度來看,一個(gè)網(wǎng)站的信息熵越多,表明網(wǎng)站包含的信息量越大,則用戶感興趣的內(nèi)容也就越多。由此可以得出結(jié)論:一個(gè)網(wǎng)站的質(zhì)量一方面體現(xiàn)于用戶瀏覽的時(shí)間,另一方面體現(xiàn)于網(wǎng)站自身的信息熵。對(duì)于一定的網(wǎng)站,其信息熵設(shè)為H(W)[3];第j個(gè)用戶組的停留時(shí)間為tj。根據(jù)本文分析及實(shí)際經(jīng)驗(yàn),提出效率熵公式:

效率熵ES是計(jì)算網(wǎng)站服務(wù)效率量化評(píng)價(jià)的標(biāo)準(zhǔn),表明了網(wǎng)站的評(píng)價(jià)與網(wǎng)站信息量和瀏覽時(shí)間的關(guān)系。利用量化的標(biāo)準(zhǔn)來對(duì)網(wǎng)站進(jìn)行評(píng)價(jià),更具客觀性和公平性。
3 實(shí)例分析
以昆明理工大學(xué)英文版主頁為例,網(wǎng)址http://www.kmust.edu.cn/en/index.htm,該網(wǎng)站的用戶分為教工組,學(xué)生組及游客組,由式(6)分別得到λ、μ與ES的關(guān)系。圖3所示為μ在一定的情況下,λ與ES成正比關(guān)系。圖4在λ固定的情況下,μ與ES也成正比趨勢;圖5所示為ES與λ、μ的三維關(guān)系圖像,說明了λ、μ與ES的正比關(guān)系。綜合λ、μ的物理意義和以上函數(shù)圖像,可以得到:網(wǎng)站信息推送的命中率越高,則導(dǎo)航結(jié)構(gòu)越合理,ES值越大;用戶的閱讀能力越強(qiáng),ES值越大。這一實(shí)驗(yàn)結(jié)果與實(shí)際情況相符。



本文根據(jù)排隊(duì)論相關(guān)理論對(duì)用戶瀏覽網(wǎng)站進(jìn)行數(shù)學(xué)建模,求得用戶組停留網(wǎng)站的平均時(shí)間。結(jié)合網(wǎng)站的信息熵提出新的網(wǎng)站評(píng)價(jià)標(biāo)準(zhǔn)——效率熵ES,給出了ES的推導(dǎo)過程,并對(duì)此公式進(jìn)行了實(shí)例驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,本公式能夠避免網(wǎng)站評(píng)價(jià)中的部分主觀因素,針對(duì)不同用戶組對(duì)網(wǎng)站進(jìn)行評(píng)價(jià),減少了評(píng)價(jià)中不公平性。同時(shí)數(shù)字化的標(biāo)準(zhǔn)增加了評(píng)價(jià)的客觀性和準(zhǔn)確性。
參考文獻(xiàn)
[1] 陸穿賚. 排隊(duì)論(第2版)[M]. 北京:北京郵電大學(xué)出版社,2009.
[2] LIU C, WHITE R, DUMAIS S. Understanding web browsing behaviors through Weibull analysis of dwell time[C].SIGlR’10:Proceeding of the 33rd International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM,2010:379-386.
[3] 姜丹.信息論與編碼(第3版)[M].合肥:中國科學(xué)技術(shù)大學(xué)出版社,2009.
