本文是一篇電子商務(wù)論文,筆者綜合本論文的研究,網(wǎng)購平臺(tái)(商家)可以從產(chǎn)品評(píng)論、網(wǎng)購流程和廣告三個(gè)方面優(yōu)化其產(chǎn)品和服務(wù),提高消費(fèi)者的滿意度和忠誠度,增加產(chǎn)品銷量。
第一章 緒論
1.1 研究背景
網(wǎng)絡(luò)市場(chǎng)匹配買賣雙方、促進(jìn)交易的職能大多數(shù)情況下通過網(wǎng)購平臺(tái)如淘寶、天貓、京東、拼多多等實(shí)現(xiàn),但是消費(fèi)者在網(wǎng)購平臺(tái)進(jìn)行購物時(shí),無法與商家進(jìn)行面對(duì)面的交流,無法看到真實(shí)的產(chǎn)品。根據(jù)埃弗雷姆·特班等(2014)[1],消費(fèi)者在網(wǎng)購平臺(tái)購買產(chǎn)品時(shí)會(huì)經(jīng)過如圖1-1所示的過程。售前階段,消費(fèi)者會(huì)通過網(wǎng)購平臺(tái)或其他渠道收集與產(chǎn)品相關(guān)的信息,包括查看其它消費(fèi)者撰寫的產(chǎn)品評(píng)論,以及瀏覽相關(guān)的廣告,然后根據(jù)產(chǎn)品評(píng)論、廣告中的內(nèi)容判斷產(chǎn)品是否滿足需求,最后做出購買決策。售中階段,消費(fèi)者在網(wǎng)購平臺(tái)完成選購、支付、安排配送等一系列過程。售后階段,消費(fèi)者根據(jù)收到的產(chǎn)品的使用情況申請(qǐng)售后服務(wù)(退換貨、退款等)或?qū)Ξa(chǎn)品做出評(píng)價(jià)(評(píng)分、撰寫產(chǎn)品評(píng)論)。商家根據(jù)購買情況衡量廣告帶來的實(shí)際效果,調(diào)整廣告的投放策略。
圖1.1會(huì)涉及到產(chǎn)品評(píng)論、網(wǎng)購流程(售前、售中、售后)、廣告,以此引出以下三個(gè)關(guān)鍵問題:
① 產(chǎn)品評(píng)論摘要生成:挖掘產(chǎn)品評(píng)論中的關(guān)鍵信息,進(jìn)而生成產(chǎn)品評(píng)論摘要,幫助商家高效理解海量產(chǎn)品評(píng)論中的主要內(nèi)容,了解產(chǎn)品的優(yōu)缺點(diǎn)。
② 網(wǎng)購流程優(yōu)化:發(fā)現(xiàn)網(wǎng)購流程中存在的問題,提出網(wǎng)購流程優(yōu)化策略,在售前、售中和售后各階段為消費(fèi)者提供更好的服務(wù)。
③ 有效和無效廣告分類:提高有效廣告識(shí)別率,幫助商家盡早移除無效廣告,降低廣告成本。
1.2 研究意義
本論文從產(chǎn)品評(píng)論摘要生成、網(wǎng)購流程優(yōu)化以及有效和無效廣告分類三個(gè)方面展開,研究具有理論和實(shí)踐兩個(gè)方面的重要意義。
1.2.1 理論意義
產(chǎn)品評(píng)論摘要生成方面,研究結(jié)合傳統(tǒng)文本挖掘方法與深度學(xué)習(xí)模型的產(chǎn)品評(píng)論摘要生成方法,為產(chǎn)品評(píng)論內(nèi)容挖掘的研究提供新的方法和思路。提出的摘要生成方法一方面保證摘要生成的信息在語法和語義上具有意義,且能反映產(chǎn)品的優(yōu)缺點(diǎn),另一方面能夠自動(dòng)歸納提取的信息,減少人工的干預(yù),提高摘要生成的效率。
網(wǎng)購流程優(yōu)化方面,結(jié)合文本挖掘技術(shù)和服務(wù)科學(xué)理論方法,對(duì)網(wǎng)購平臺(tái)的網(wǎng)購流程進(jìn)行評(píng)價(jià)和優(yōu)化,擴(kuò)展網(wǎng)購平臺(tái)服務(wù)質(zhì)量研究的方向、方法和思路。網(wǎng)購流程的優(yōu)化有利于提高消費(fèi)者的購物體驗(yàn),規(guī)范對(duì)商家的管理,減少購物糾紛,而目前有關(guān)網(wǎng)購平臺(tái)服務(wù)質(zhì)量的研究沒有從網(wǎng)購流程的角度出發(fā),研究其存在的問題并提出優(yōu)化策略。
有效和無效廣告分類方面,建立廣告分類模型,提高有效廣告識(shí)別率,為廣告效果評(píng)價(jià)的研究提供新的方法和思路?;诳陀^的業(yè)務(wù)數(shù)據(jù)的廣告分類模型,能夠一定程度避免當(dāng)前廣告效果評(píng)價(jià)的研究中數(shù)據(jù)樣本量不足,數(shù)據(jù)偏性,主觀性強(qiáng),量化困難等問題,有效解決有效廣告和無效廣告的分類問題。
1.2.2 實(shí)踐意義
產(chǎn)品評(píng)論摘要生成方面,提出的摘要生成方法能夠根據(jù)海量產(chǎn)品評(píng)論生成反映產(chǎn)品優(yōu)缺點(diǎn)的摘要。商家能夠從中發(fā)現(xiàn)產(chǎn)品的受歡迎之處以及其有待改進(jìn)之處,根據(jù)實(shí)際情況決定銷售策略和補(bǔ)貨策略;平臺(tái)管理者能夠根據(jù)分析結(jié)果對(duì)平臺(tái)的產(chǎn)品進(jìn)行管理,及時(shí)發(fā)現(xiàn)假冒或劣質(zhì)產(chǎn)品,保證平臺(tái)產(chǎn)品的質(zhì)量。
網(wǎng)購流程優(yōu)化方面,提出的優(yōu)化方法能夠?yàn)槠脚_(tái)管理者評(píng)價(jià)和優(yōu)化網(wǎng)購流程提供指導(dǎo)。一方面有利于營造良好的購物環(huán)境,提高消費(fèi)者購物體驗(yàn);另一方面有利于對(duì)商家的管理和規(guī)范,減少購物糾紛。
有效和無效廣告分類方面,提出的分類模型能夠提高有效廣告識(shí)別率,一方面幫助商家盡早移除無效廣告提供參考,節(jié)省成本,另一方面為消費(fèi)者提供更為優(yōu)質(zhì)的廣告,提高其購物體驗(yàn)。
第二章 文獻(xiàn)綜述
2.1 文本特征選擇
研究發(fā)現(xiàn),從特征選擇的理念出發(fā),文本特征選擇方法可以分為“評(píng)分機(jī)制”、“篩選機(jī)制”以及“優(yōu)化機(jī)制”三大類?;凇霸u(píng)分機(jī)制”的特征選擇利用評(píng)分公式對(duì)每一個(gè)詞進(jìn)行單獨(dú)的評(píng)價(jià),然后選擇排名靠前的詞組成特征選擇后的關(guān)鍵詞集;基于“篩選機(jī)制”的特征選擇首先利用評(píng)分公式對(duì)詞進(jìn)行評(píng)價(jià),然后通過人為設(shè)定的方法得到關(guān)鍵詞集;基于“優(yōu)化機(jī)制”的特征選擇利用最優(yōu)化理論和方法得到關(guān)鍵詞集。
2.1.1 基于“評(píng)分機(jī)制”的特征選擇
基于“評(píng)分機(jī)制”的特征選擇方法利用預(yù)先設(shè)計(jì)的評(píng)分公式對(duì)文本中每一個(gè)詞進(jìn)行獨(dú)立評(píng)價(jià),得出詞的評(píng)分,獲得高評(píng)分的詞就是關(guān)鍵詞。按照評(píng)分的高低,結(jié)合實(shí)際的情況如計(jì)算資源的限制,實(shí)際場(chǎng)景中對(duì)詞數(shù)量的限制等,選擇評(píng)分排在前面的??個(gè)詞組成關(guān)鍵詞集。
為了方便敘述,首先做符號(hào)的規(guī)定:
規(guī)定1(基本元素)
??:文本集合??中的任意一個(gè)詞 ??:類標(biāo)簽集合??中的任意一個(gè)類 ??: ??中除??以外的所有類
規(guī)定2(條件概率)
??(??|??):??出現(xiàn)在屬于??的文本的概率 ??(??|??):??出現(xiàn)在屬于??的文本的概率 ??(??| ??):??不出現(xiàn)在屬于??的文本的概率 ??(??|??) :??出現(xiàn)在不屬于??的文本的概率 ??(??| ??) :??不出現(xiàn)在不屬于??的的文本的概率 ??(??|??):包含??的文本屬于??的概率 ??(??| ??):包含??的文本不屬于??的概率 ??(??| ??) :不包含??的文本不屬于??的概率 ??(??):??在文本中出現(xiàn)的概率 ??(??):屬于??的文本出現(xiàn)的概率
2.2 產(chǎn)品評(píng)論摘要相關(guān)技術(shù)研究
產(chǎn)品評(píng)論摘要生成包括關(guān)鍵信息提取和關(guān)鍵信息組織兩個(gè)過程。關(guān)鍵信息提取過程從產(chǎn)品評(píng)論中提取反映產(chǎn)品優(yōu)缺點(diǎn)的信息,即產(chǎn)品屬性及其對(duì)應(yīng)的情感評(píng)價(jià)組成的“(產(chǎn)品屬性,情感評(píng)價(jià))”詞對(duì)。關(guān)鍵信息組織過程整合提取的關(guān)鍵信息,生成產(chǎn)品評(píng)論摘要。
2.2.1 關(guān)鍵信息提取
實(shí)現(xiàn)關(guān)鍵信息提取的方法可以是一次性將產(chǎn)品屬性和情感評(píng)價(jià)同時(shí)提取出來并形成“(產(chǎn)品屬性,情感評(píng)價(jià))” 詞對(duì)(一階段方法),也可以是分別提取產(chǎn)品屬性和情感評(píng)價(jià),再將提取的產(chǎn)品屬性和情感評(píng)價(jià)匹配起來,形成“(產(chǎn)品屬性,情感評(píng)價(jià))”詞對(duì)(二階段方法)。
2.2.1.1 一階段方法
有研究利用簡單的規(guī)則實(shí)現(xiàn)了“(產(chǎn)品屬性,情感評(píng)價(jià))” 詞對(duì)的提取。沈炎軍(2017)[79]以及劉柏嵩和趙福青(2015)[80]首先基于依存句法分析評(píng)論中詞與詞的依存關(guān)系,然后預(yù)定了了若干依存關(guān)系模板,最后根據(jù)模板直接從評(píng)論中提取“(產(chǎn)品屬性,情感評(píng)價(jià))”詞對(duì)。馬京苗(2017)[81]通過關(guān)聯(lián)規(guī)則挖掘產(chǎn)品評(píng)論總結(jié)出頻繁項(xiàng)集,形成相關(guān)的規(guī)則,然后通過情感評(píng)價(jià)匹配的方法得到“(產(chǎn)品屬性,情感評(píng)價(jià))”詞對(duì)。唐曉波和蘭玉婷(2016)[82]首先構(gòu)建產(chǎn)品屬性和情感評(píng)價(jià)的領(lǐng)域本體,然后利用相關(guān)方法計(jì)算情感評(píng)價(jià)和領(lǐng)域本體中的產(chǎn)品屬性的大類的關(guān)聯(lián)度,關(guān)聯(lián)度高的大類與情感評(píng)價(jià)匹配起來,形成“(產(chǎn)品屬性,情感評(píng)價(jià))”詞對(duì)。
第三章 基于深度學(xué)習(xí)的特征選擇方法研究 ..................... 34
3.1 引言 ................................. 34
3.2 理論基礎(chǔ) ............................. 34
第四章 產(chǎn)品評(píng)論摘要生成方法研究 .............................. 77
4.1 引言 ................................... 77
4.2 基礎(chǔ)理論 ........................... 77
第五章 基于文本挖掘和PCN的網(wǎng)購流程優(yōu)化方法研究 ...............................111
5.1 引言 ......................................111
5.2 PCN的原理 .............................111
第六章 基于高斯濾波和決策樹的廣告分類模型研究
6.1 引言
商家會(huì)通過投放廣告的方式吸引更多潛在消費(fèi)者,提升銷量。有效廣告能夠吸引更多潛在消費(fèi)者,為商家?guī)砀嗟匿N量和利潤,然而,無效廣告不僅不能吸引消費(fèi)者,而且增加了商家投放廣告的成本。廣告效果評(píng)價(jià)能夠幫助商家識(shí)別有效廣告和無效廣告。
當(dāng)前關(guān)于廣告效果評(píng)價(jià)的研究存在局限性:采用的數(shù)據(jù)大多來源于訪談?wù)邔?duì)廣告的主觀感受、調(diào)查問卷等,可能會(huì)出現(xiàn)樣本量不足,數(shù)據(jù)偏性,主觀性強(qiáng),量化困難等問題;沒有從客觀的業(yè)務(wù)數(shù)據(jù)(通過廣告下訂單總數(shù)、通過廣告成功購買產(chǎn)品的總金額等)出發(fā)研究廣告對(duì)商家的銷售帶來的實(shí)際效果,解決如何識(shí)別有效廣告和無效廣告的問題。針對(duì)上述問題,本論文基于業(yè)務(wù)數(shù)據(jù),提出基于高斯濾波和決策樹的廣告分類模型M-GFDT(Model based on Gaussian Filterand Decision Tree)。
M-GFDT針對(duì)已經(jīng)投放的廣告,通過分析業(yè)務(wù)數(shù)據(jù)實(shí)現(xiàn)有效廣告和無效廣告的分類。廣告的業(yè)務(wù)數(shù)據(jù)是量化數(shù)據(jù),包含反映廣告的業(yè)務(wù)能力的屬性,例如,當(dāng)天對(duì)廣告產(chǎn)生行為的用戶數(shù)量、當(dāng)天通過廣告產(chǎn)生購買行為的用戶數(shù)量、當(dāng)天通過廣告購買產(chǎn)品的總金額、當(dāng)天通過廣告的下單數(shù)、當(dāng)天通過廣告瀏覽產(chǎn)品頁面的數(shù)量等。廣告的業(yè)務(wù)能力是指廣告吸引消費(fèi)者,引發(fā)產(chǎn)品購買的能力。業(yè)務(wù)數(shù)據(jù)是客觀的量化數(shù)據(jù),能夠反映廣告為商家的銷售帶來的實(shí)際效果,能夠避免訪談、調(diào)研等導(dǎo)致的數(shù)據(jù)主觀性和偏性,難以量化等問題,因此,以業(yè)務(wù)數(shù)據(jù)建立廣告分類模型。
第七章 總結(jié)與展望
7.1 研究總結(jié)
本論文圍繞文本特征選擇、產(chǎn)品評(píng)論摘要生成、網(wǎng)購流程優(yōu)化、廣告分類模型四個(gè)方面展開研究。
(1)文本特征選擇方法研究
提出了兩種基于深度學(xué)習(xí)的特征選擇方法:CNN-FS和LSTM-FS。兩種方法利用文本數(shù)據(jù)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),然后利用訓(xùn)練好的網(wǎng)絡(luò)完成特征選擇。CNN-FS采用的深度神經(jīng)網(wǎng)絡(luò)是一個(gè)三層的CNN和多層感知機(jī)的全連接層的組合,而LSTM-FS采用的深度神經(jīng)網(wǎng)絡(luò)是一個(gè)LSTM單元和全連接層的組合。實(shí)驗(yàn)結(jié)果證明了CNN-FS和LSTM-FS在文本特征選擇方面的有效性。
(2)產(chǎn)品評(píng)論摘要生成方法研究
提出了結(jié)合詞性、LDA主題模型、特征選擇和深度學(xué)習(xí)模型的產(chǎn)品評(píng)論摘要生成方法。該方法利用詞性規(guī)則、LDA主題模型、特征選擇對(duì)產(chǎn)品評(píng)論中的信息進(jìn)行篩選,保證提取的關(guān)鍵信息具備語法和語義兩個(gè)方面的意義,同時(shí)能夠反映產(chǎn)品的優(yōu)缺點(diǎn);利用深度學(xué)習(xí)模型LSTM網(wǎng)絡(luò)對(duì)篩選后的信息進(jìn)行總結(jié)和歸納,減少人工的干預(yù),實(shí)現(xiàn)自動(dòng)化摘要生成過程,提高摘要生成的效率。實(shí)驗(yàn)結(jié)果表明了提出的方法的有效性。
(3)網(wǎng)購流程優(yōu)化研究
提出了網(wǎng)購流程優(yōu)化方法。該方法首先利用第四章提出的產(chǎn)品評(píng)論摘要生成方法生成消費(fèi)者投訴文本的摘要,進(jìn)而分析網(wǎng)購平臺(tái)存在的問題,包括客服人員不合格的服務(wù)行為,假貨、商品損壞或有瑕疵,賣家虛假發(fā)或超時(shí)貨、虛假宣傳,以及物流空包和快遞破損四個(gè)方面的問題;然后針對(duì)發(fā)現(xiàn)的問題,利用服務(wù)科學(xué)模型PCN描繪網(wǎng)購流程并提出了針對(duì)性的網(wǎng)購流程優(yōu)化策略。最后,就如何有效實(shí)施提出的三個(gè)PCN優(yōu)化策略提出建議,包括客服服務(wù)質(zhì)量提升、售前商品管理以及商家發(fā)貨管理三部分。
參考文獻(xiàn)(略)
相關(guān)文章
UKthesis provides an online writing service for all types of academic writing. Check out some of them and don't hesitate to place your order.