劉濱;張靜遠;劉強;趙靜陽;李寒;徐巍巍;微博,是當前重要的社會信息傳播平臺之一,具有易操作、傳播快等特點,人們可以通過微博直接快速地表達對突發事件、公眾人物、熱門產品等的觀點。為了利用海量微博信息,需要綜合多種分析方法挖掘其潛在價值。綜述了當前微博分析領域的研究現狀,提出了自主研發的微博分析系統,探討了未來微博分析的研究方向。首先,介紹了微博分析的主要技術方法,包括利用微博開放平臺和利用網絡爬蟲技術。利用微博提供的開放接口,可以方便快捷地獲取微博信息,如微博內容、用戶評論、用戶個人詳情、粉絲數、關注數等。但也存在諸多限制,如每小時只能抓取有限次數、微博平臺并不開放所有信息資源等。利用網絡爬蟲技術可以獲取更多信息,如基于全網的網絡爬蟲的信息采集技術可以覆蓋更廣的范圍,基于主題的網絡爬蟲的信息采集技術可以選擇性爬取預先設定的主題等。其次,介紹了目前微博分析的熱點問題,包括微博用戶行為和微博內容兩方面。微博用戶行為分析包括:1)傳播網絡研究,利用Gephi等可視化工具,呈現出微博在傳播過程中的傳播路徑、傳播范圍、關鍵轉發節點等信息,可用于預測未來傳播情況;2)傳播因素研究,通過分析用戶行為,揭示信息傳播的可能原因;3)用戶影響力分析,不同學者給出不同的度量方法,而要精準地評價用戶影響力需要綜合考慮多方面因素,如粉絲數、轉發數、被提及數、回復、社會關系等。關于微博內容的分析包括:1)微博文本預處理,包括分詞和去停用詞2個步驟;2)微博熱點話題發現,常用方法包括基于詞頻的統計方法和文本聚類方法,這兩種方法都有利于提高發現熱點話題的效果,但沒有考慮到話題動態演變的特性;3)情感分析,也被稱為觀點挖掘,一直是微博研究領域的熱點問題,可以利用微博表情圖片抽取情感詞,并結合構建語義詞典和機器學習的方法對微博進行情感分類,最終判斷微博情感極性,可用于輿情監控、商業預測和產品選擇等方面。再次,提出了自主研發的微博分析系統——閱微,重點介紹了其情感分析、地域分布和傳播圖3個模塊。情感分析模塊,基于情感詞典的方法對用戶的評論內容進行情感分類;地域分布模塊,提取參與用戶的地理位置信息并加以統計分析,呈現出微博傳播在全國范圍內的分布情況;傳播圖模塊,利用可視化手段展現微博信息的傳播擴散情況,如轉發關系、轉發層級、轉發范圍等情況。最后,歸納全文,從技術和應用2個方面歸納微博分析的挑戰問題:可從技術上突破微博接口資源限制,提高微博分析的效率和精準度;同時從微博應用方面發展事件監控、管理和商業方面的應用。
2015年01期 v.36;No.122 100-110頁 [查看摘要][在線閱讀][下載 29832352] [下載次數:2870 ] |[網刊下載次數:240 ] |[引用頻次:40 ] |[閱讀次數:375 ]