![](/images/contact.png)
1 引 言
在線評論被認為是傳統(tǒng)口碑的數(shù)字化表現(xiàn)形式[1],承載了消費者的直接產(chǎn)品體驗,蘊含了大量的管理和決策支持信息。其價值可以從買方和賣方兩方面來分析:
?。?) 買方價值:在線評論屬于一種無偏產(chǎn)品信息,其可信度大大高于商家的促銷信息,對潛在客戶的購買決策具有重要影響[2]。
(2) 賣方價值:廠商可以通過對用戶發(fā)表的在線評論的研究,來發(fā)現(xiàn)用戶對本企業(yè)產(chǎn)品的滿意程度,本產(chǎn)品與同類產(chǎn)品相比的優(yōu)勢和劣勢,據(jù)此對產(chǎn)品進行改進,從而增強企業(yè)競爭力。
然而,隨著在線評論的不斷增加,在線評論也出現(xiàn)了信息爆炸時代的普遍問題——信息過載[3-4]。在線評論數(shù)量的巨大和質(zhì)量的參差不齊嚴重干擾了評論閱讀者對產(chǎn)品質(zhì)量的有效判斷,增加了信息搜尋成本,降低了決策的效率[5]。因此,有效地識別在線評論的價值就顯得至關(guān)重要。
許多電子商務(wù)網(wǎng)站會鼓勵閱讀者對自己看到的在線評論進行投票,然后利用投票數(shù)來評價一條評論的有用性。本文在現(xiàn)有研究的基礎(chǔ)上,構(gòu)建在線評論投票數(shù)的影響因素模型。本文的研究目的是更好地解釋為什么有的評論會得到較多的投票數(shù),而有的評論只得到很少的投票數(shù)。
本文收集了中國最大的電子產(chǎn)品交易網(wǎng)站——京東商城熱門手機的在線評論信息,結(jié)合文本挖掘技術(shù)和實證研究方法,從數(shù)字特征、寫作風格和語義3個維度來研究在線評論投票數(shù)的影響因素、作用方向和重要程度。本文內(nèi)容組織如下:第2節(jié),根據(jù)相關(guān)理論和文獻研究提出理論假設(shè),建立在線評論投票數(shù)的影響因素模型。第3節(jié),闡述數(shù)據(jù)采集、處理和實證分析的過程,并對分析結(jié)果進行分析和解釋。第4節(jié),給出研究結(jié)論及其意義,并指出研究局限和后續(xù)研究方向。
?。?模型與理論假設(shè)
在之前研究的基礎(chǔ)上,本文構(gòu)建的在線評論投票數(shù)影響因素模型如圖1所示。
2.1 數(shù)字特征維度
數(shù)字特征指的是不涉及文本內(nèi)容的信息,包括:① 產(chǎn)品的平均得分,記為AvgScore。② 評論者評分,記為Rating。③ 評論發(fā)表距今的時間間隔,記為ElapsedDay。④ 評論者是否填寫了產(chǎn)品的不足,記為NoDisadv。
文獻[6]研究表明評論者是否填寫了產(chǎn)品的不足對投票數(shù)沒有顯著影響,這與之前的研究略有出入。消費者通常會認為負面信息比正面信息更具診斷價值,因而在做購買決策時更多地依賴負面信息[5] ,而產(chǎn)品的不足反映的正是其負面信息,由此,本文提出假設(shè)H1。
H1:評論者是否填寫了產(chǎn)品的不足對投票數(shù)有顯著的正向影響。
2.2 寫作風格維度
寫作風格反映了評論人寫作的特點。寫作風格主要體現(xiàn)在正文各部分內(nèi)容(優(yōu)點、不足和使用心得)是否相同,文本長度,平均句長和評論的主觀性等方面。
評論可以分為標題和正文。標題通常比較短,評論者的寫作風格主要體現(xiàn)在正文里,所以本文中寫作風格主要指的是正文風格。寫作風格包括:① 正文各部分內(nèi)容(優(yōu)點、不足和使用心得)是否相同,記為Same。② 文本長度。評論分為標題和正文兩部分,標題長度記為TitLen,正文長度記為ConLen。本文將長度作為文本信息量的一個度量指標。③ 平均句長,記為AvgLen。④ 評論的主觀性,記為Sub。本文把評論中形容詞所占比重作為評論主觀性的代理指標。
正文各部分內(nèi)容(即優(yōu)點、不足和使用心得)是否相同以及評論的主觀性是本文新加入模型的影響因素。
評論者在優(yōu)點、不足和使用心得中填寫相同的內(nèi)容,可能的原因是:用重復(fù)來強調(diào)自己滿意或者不滿意的強烈情感;發(fā)表評論僅為了獲得網(wǎng)站的積分,復(fù)制粘貼可以節(jié)約時間?;谝陨系姆治觯⒉荒軘喽ㄕ母鞑糠謨?nèi)容是否相同對投票數(shù)的影響是正向還是負向。正文分為優(yōu)點、不足和使用心得3部分,通常來講,優(yōu)點是對產(chǎn)品的正面評價,不足是對產(chǎn)品的負面評價,使用心得是對產(chǎn)品的總體評價,表達正面情感或者負面情感均可。若優(yōu)點和不足填寫了相同的內(nèi)容,評論者可能是想通過這種重復(fù)來強調(diào)自己的某種情感(滿意或者不滿意),那么它對投票數(shù)有正向影響;若使用心得和優(yōu)點或者是不足內(nèi)容相同,這樣就會減少評論的信息量,可能會對投票數(shù)有負向影響。由此,本文提出假設(shè)H2。
H2:正文各部分內(nèi)容是否相同對投票數(shù)有影響,但不確定是正向還是負向。
?。龋玻幔涸u論優(yōu)點和不足內(nèi)容是否相同對投票數(shù)有顯著的正向影響。
H2b:評論優(yōu)點和使用心得內(nèi)容是否相同對投票數(shù)有顯著的負向影響。
H2c:評論不足和使用心得內(nèi)容是否相同對投票數(shù)有顯著的負向影響。
文獻[7]把評論文本內(nèi)容分為客觀和主觀兩類。文獻[8]研究了文本的主觀性對在線評論有用性的影響,結(jié)果發(fā)現(xiàn),評論的主觀性越大,評論的有用性越低。由此,本文提出假設(shè)H3。
?。龋常涸u論的主觀性對評論的投票數(shù)有顯著的負向影響。
2.3 語義維度
文獻[6]研究表明語義是影響投票數(shù)的重要因素,但是并沒有深入研究每一個詞語對投票數(shù)的影響,且由于采用了因子分析的方法,實驗結(jié)果比較難以解釋。挖掘重要產(chǎn)品特征和判斷評論觀點的情感傾向是在線評論挖掘的兩個很重要的方面[9],所以本文假設(shè)產(chǎn)品特征和觀點的強烈程度對投票數(shù)有顯著影響。文獻[5,10]都直接把評論者評分作為評論者情感傾向的代理指標,并未從語義的角度來考慮情感傾向及其程度,所以本文將通過情感程度詞來展現(xiàn)評論者情感強烈程度。本文擴展了原模型中語義對投票數(shù)的影響,從產(chǎn)品特征詞(記為Feature)、產(chǎn)品故障詞(記為Breakdown)和情感程度詞(記為SenDe) 3方面來研究語義對投票數(shù)的影響。