本文是一篇電子商務(wù)論文,本文設(shè)計了基于LSTM的孿生屬性注意力網(wǎng)絡(luò)(SiameseATT)用于候選屬性選擇,SiameseATT網(wǎng)絡(luò)大大提高了商品智能問答中屬性選擇的性能。其次,我們通過知識圖譜的本體規(guī)則推理,將多跳屬性轉(zhuǎn)換為1跳屬性,解決了復(fù)雜的多跳屬性問答的問題。
1.緒論
1.1 電子商務(wù)及其客戶服務(wù)
隨著互聯(lián)網(wǎng)的迅速普及和信息技術(shù)的不斷創(chuàng)新,整個人類社會進入了互聯(lián)網(wǎng)經(jīng)濟時代。與此同時,在消費領(lǐng)域,基于互聯(lián)網(wǎng)技術(shù)的電子商務(wù)(Electronic Commerce)已逐漸改變了人們的生活習(xí)慣和購物方式,越來越多的人開始使用網(wǎng)上購物。電子商務(wù)發(fā)展至今不過20年,卻給我們的生活帶來了翻天覆地的變化。
電子商務(wù)是指以電子化的方式實現(xiàn)整個商貿(mào)過程的各階段的活動,包括供應(yīng)鏈管理、電子支付、電子交易市場、在線營銷、在線交易處理和電子數(shù)據(jù)交換等[1]。近年來,許多電子商務(wù)企業(yè),例如淘寶(www.taobao.com)、京東(www.jd.com)、拼多多(www.pinduoduo.com)和亞馬遜(www.amazon.com)等飛速發(fā)展,逐漸占領(lǐng)消費市場并獲得了巨大的成功。電子商務(wù)因其低成本、高效率和便利性,成為經(jīng)濟增長的新動力[1]。特別是最近十年,我國電子商務(wù)行業(yè)持續(xù)保持兩位數(shù)的高速增長。據(jù)網(wǎng)經(jīng)社“電數(shù)寶”電商大數(shù)據(jù)庫(DATA.100EC.CN)顯示1 (如圖1-1所示),2019年國內(nèi)網(wǎng)絡(luò)零售市場交易規(guī)模達10.32萬億元,較2018年的8.56萬億元,同比增長20.56%。與此同時,2019年國內(nèi)網(wǎng)絡(luò)零售用戶規(guī)模達7.32億人,較2018年的5.7億人,同比增長28.42%。
1.2 面向電子商務(wù)的智能客戶服務(wù)
近年來,面對日益增加的網(wǎng)購用戶和在線商品,諸如淘寶、京東、拼多多和亞馬遜等國內(nèi)外大型電子商務(wù)企業(yè)啟用了大量人力、物力、財力和信息系統(tǒng)來支撐客戶服務(wù)。然而,電子商務(wù)客戶服務(wù)的一些問題依然不可避免地出現(xiàn),例如服務(wù)支撐可用性有限、效率低下和成本高昂等[2]。具體而言,主要面對如下幾個突出問題:
1、如何及時、準確和低成本地回答用戶問題?
在線購物時,用戶為快速了解商品的詳細信息,常常會提出一些關(guān)于商品的問題,如“這款小米手機內(nèi)存多大?這款打底衫是什么材質(zhì)的?”等。許多商家都招聘了一定數(shù)量的客戶服務(wù)人員來在線解答這些問題。但實際上,用戶提出的問題大部分是重復(fù)的,許多高頻問題會經(jīng)常被詢問。因此,如果全由客服人員回答這些重復(fù)的問題是一項費時耗力的工作。同時,企業(yè)需要招聘大量的人員來回答這些問題,這種方式大大增加了企業(yè)服務(wù)成本。另一方面,由于有些咨詢問題較為專業(yè),許多客服人員也無法快速準確地回復(fù),由此影響了商品的銷售和用戶的體驗。再者,當某些節(jié)假日臨近或商家促銷時,購物的客流量會出現(xiàn)大幅激增,由于客服人員接待能力有限,此時便會出現(xiàn)許多用戶無人接管的情況,從而白白失去大量的銷售機會。同樣地,客戶服務(wù)人員也無法7×24小時不間斷工作,在夜間或其他休息時間的用戶咨詢問題也沒法及時回答,從而導(dǎo)致用戶流失。因此,如何及時、準確和低成本地回答用戶的問題是電子商務(wù)客戶服務(wù)當前所面臨的一個挑戰(zhàn)2。
2、如何向用戶推薦合適的商品?
電子商務(wù)網(wǎng)站存在成千上萬的商品,面對這些琳瑯滿目的商品,許多用戶會出現(xiàn)選擇困難,無從下手的情況。另外,由于商品眾多,一些新上市商品也不能第一時間被用戶發(fā)現(xiàn),從而失去了大量銷售的機會。因此,如何為用戶推薦合適的商品成為電子商務(wù)企業(yè)銷售中至關(guān)重要的一環(huán),同時也是客戶服務(wù)人員的重要工作之一。恰當?shù)叵蛴脩敉扑]商品,既可以增加企業(yè)的銷售量,又可以提高用戶的滿意度。在傳統(tǒng)的線下購物中,許多商家都會雇傭?qū)I(yè)的導(dǎo)購人員來推銷商品。他們具有豐富的銷售經(jīng)驗,會根據(jù)用戶的要求和實際情況適時地向用戶進行推銷。但在電子商務(wù)中,網(wǎng)絡(luò)購物的用戶與客戶服務(wù)人員無法進行面對面溝通和交流,這導(dǎo)致客服人員對用戶的實際情況了解較少,很難做出合適地商品推薦。另一方面,在線商品眾多,客服人員很難準確地進行推薦。因此,如何向用戶推薦合適的商品成為電子商務(wù)客戶服務(wù)面對的一個關(guān)鍵問題。
2.基于知識圖譜和規(guī)則推理的商品智能問答模型
2.1 引言
近年來,隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)上購物已逐漸成為人們生活購物的一種主要方式。在線下購物時,用戶通常向客服人員面對面地咨詢各類商品問題,通過客服人員的介紹,用戶可以先充分了解商品的信息再做出購買決策。同樣地,在線購物時用戶也常常會對商品提出一系列咨詢問題,例如“這款小米手機的內(nèi)存多大?”,“這款格力空調(diào)每小時耗電多少?”等。一般來說,電子商務(wù)企業(yè)都有在線客戶服務(wù)人員,用戶可通過發(fā)送圖片、文字或語音的方式與在線客服人員交流溝通商品問題。然而,這些咨詢問題很大部分是重復(fù)的,全由人工來回答這些重復(fù)的問題是一件非常耗時耗力的工作。另一方面,一些比較專業(yè)的問題要求在線客服人員具有較高的專業(yè)素養(yǎng),例如用戶咨詢商品的某些技術(shù)參數(shù)、適配環(huán)境等問題。顯然,大部分客服人員很難準確無誤地記憶各種商品參數(shù),特別是在商品較多或更新較為頻繁時。在這樣的情況下,許多電子商務(wù)企業(yè)希望能夠通過商品智能問答系統(tǒng)來減少客服人員成本,同時提高問題回答的準確率。因此,商品智能問答系統(tǒng)具有很高的應(yīng)用價值和研究價值。
在目前的應(yīng)用中,許多在線商品智能問答系統(tǒng)是通過意圖識別(用戶問題識別)和人工的答案配置來實現(xiàn)的。意圖識別本質(zhì)上是一個文本分類任務(wù),它需要訓(xùn)練一個文本分類器來識別“用戶問題”所表達的意圖,接著,通過人工對每個意圖配置固定的答案來實現(xiàn)商品的智能問答。總而言之,基于意圖識別的商品智能問答使用較為靈活多樣、可定制性強且方法簡單可靠。正因如此,如今許多小型電商企業(yè)常采用這種方法來實現(xiàn)商品智能問答。但該方法也存在一些不足,例如答案的配置過度依賴人工,對于同樣的意圖(問題)需要對每個商品單獨配置答案。因此,對商品比較多的大型電商企業(yè)而言,這種方法需要的配置工作量巨大,實用性較差。另外一些研究則嘗試通過評論中的內(nèi)容來解答用戶的問題。他們通過檢索式的方法找到評論中與問題最相關(guān)的部分,隨后將這部分內(nèi)容作為用戶問題的答案。與意圖識別的方法相比,這種方法不需要人工配置答案,但需要依賴一定數(shù)量的高質(zhì)量的商品評論。然而,在實際中許多商品不僅沒有大量的高質(zhì)量評論,甚至很多商品鮮有評論。因此,這類方法在應(yīng)用中也存在很大的局限性。近年來,隨著知識圖譜技術(shù)的發(fā)展,基于知識圖譜的商品智能問答逐漸成為研究的熱點。基于知識圖譜的方法不需要配置答案,也不需要依賴高質(zhì)量的評論,答案來自于知識圖譜。因此,這種方法相對于其他方法而言更為實用和高效,近年來被廣泛地使用在電子商務(wù)的商品智能問答中。
2.2 商品智能問答研究現(xiàn)狀
眾所周知,商品智能問答在大型電商企業(yè)中已得到廣泛的應(yīng)用,例如“阿里小蜜”、“百度小度”和“京東JIMI”等。這些商品智能問答系統(tǒng)能夠自動回復(fù)用戶的問題,從而大大提高了商家的接待能力,降低了人力成本,并實現(xiàn)了7×24小時不間斷服務(wù)??傮w來講,商品智能問答不同于其他開放域的智能問答,它的回答內(nèi)容控制在商家所售商品領(lǐng)域,對于其他的閑聊問題并不作答,是一種限定域的問答系統(tǒng)。相較于其他智能問答,商品智能問答更要求答案的準確率和專業(yè)性。目前對商品智能問答的研究主要分為以下3類:基于意圖識別和答案配置的智能問答、基于知識圖譜的智能問答和基于評論的智能問答。
2.2.1 基于意圖識別和答案配置的商品智能問答
如前文所述,一些中小型電子商務(wù)企業(yè)廣泛使用的在線商品智能問答主要是通過意圖識別和人工答案配置來實現(xiàn)的。意圖識別本質(zhì)上是一個文本分類任務(wù)(Question Classification),該算法能夠根據(jù)用戶提問的直接或者間接的信息來判斷用戶的真實意圖。在識別用戶意圖后,再將事先由人工配置的意圖所對應(yīng)的答案話術(shù)發(fā)送給咨詢用戶,即可實現(xiàn)智能問答。由此可見,該方法的重點和難點在于意圖識別。目前意圖識別的方法主要包括基于規(guī)則和人工特征工程的方法以及基于深度學(xué)習(xí)的方法。
3.基于知識圖譜的商品搭配推薦模型 ............................... 50
3.1 引言 ................................. 50
3.2 商品搭配推薦系統(tǒng)研究現(xiàn)狀 ................................ 53
4.基于外部記憶網(wǎng)絡(luò)的評論有用性預(yù)測模型 ......................... 79
4.1 引言 ........................... 79
4.2 評論有用性預(yù)測研究現(xiàn)狀 .................................. 83
5.基于聯(lián)合注意力機制的評論方面類別檢測模型 .................... 104
5.1 引言 ................................................... 104
5.2 評論方面類別檢測研究現(xiàn)狀 ............................... 106
5.基于聯(lián)合注意力機制的評論方面類別檢測模型
5.1 引言
近年來,情感分析和評論挖掘已成為學(xué)術(shù)界和工業(yè)界的熱門研究領(lǐng)域。如前文所述,在評論的意見挖掘中,我們面對的一個挑戰(zhàn)就是如何將標簽(類別)準確的分配給評論中的各個方面,這個工作稱為“方面類別檢測”(Aspect Category Detection ,ACD)。例如,一句這樣的評論“這個餐廳的服務(wù)真的很好!” ,我們可以為其指定一個方面類別“服務(wù)”。而另一句評論“餐廳的服務(wù)員非常好,但菜也真的不錯!”,這條評論我們可以為其分配兩個類別,即“服務(wù)和食品”??梢钥匆?,方面類別檢測任務(wù)可以從評論中抽取更細膩度的意見,從而幫助公司改進其產(chǎn)品或幫助用戶快速檢索感興趣的評論內(nèi)容。
目前的研究把評論方面類別檢測任務(wù)的方法分為了三類:無監(jiān)督的方法、有監(jiān)督的方法和半監(jiān)督的方法。無監(jiān)督的方法主要是利用詞典、規(guī)則或聚類的方法來完成。其中基于詞典的方法[165]主要結(jié)合意見詞典(如“精彩”、“昂貴”)和某些語法規(guī)則來執(zhí)行任務(wù)?;谠~典的方法簡單有效且不需要標記數(shù)據(jù)集,但需要預(yù)先設(shè)計規(guī)則和建立詞典,因此該方法不能很好地處理那些包含隱含語義的或較為復(fù)雜的句子。近年來,在評論方面類別檢測的研究中基于機器學(xué)習(xí)的方法逐漸興起,例如SVM[166]、神經(jīng)網(wǎng)絡(luò)模型[167]等方法在評論方面識別任務(wù)中均取得了不錯的效果。機器學(xué)習(xí)的方法是有監(jiān)督的方法,雖然有監(jiān)督的方法能獲得較好的效果,但該方法需要大量的人工標記的數(shù)據(jù),因此一些半監(jiān)督學(xué)習(xí)方法被應(yīng)用于評論方面類別檢測中。
6.全文總結(jié)與展望
6.1 全文工作總結(jié)
近年來,隨著互聯(lián)網(wǎng)技術(shù)的出現(xiàn)和發(fā)展,電子商務(wù)已成為人們購物和生活不可或缺的一部分。電子商務(wù)企業(yè)秉承以客戶和產(chǎn)品為中心的理念,因此在電子商務(wù)中客戶服務(wù)是其至關(guān)重要的一個環(huán)節(jié)。近年來,許多電子商務(wù)企業(yè)將人工智能和大數(shù)據(jù)等智能技術(shù)與電子商務(wù)客戶服務(wù)緊密地結(jié)合,使得電子商務(wù)客戶服務(wù)更為智能化和自動化,由此邁入了智能客戶服務(wù)的時代。然而,面對日益激增的用戶群體和海量的商品,智能客戶服務(wù)也直面許多挑戰(zhàn)。本文在這樣的時代背景下,從電子商務(wù)客戶服務(wù)所面對業(yè)務(wù)問題入手,調(diào)研當前已存在的解決方案(智能技術(shù)),重點對其中的關(guān)鍵技術(shù)進行分析和研究,主要包括:商品智能問答、商品搭配推薦、評論有用性預(yù)測和評論方面類別檢測等4個關(guān)鍵技術(shù)。進一步,在相關(guān)理論和數(shù)據(jù)的支撐下,對這些關(guān)鍵技術(shù)進行改進和優(yōu)化,最后在真實的電子商務(wù)數(shù)據(jù)集中對研究的方法進行驗證。本文的研究工作主要包括:
1、針對目前知識圖譜的商品智能問答存在的問題,本文提出一種基于知識圖譜和本體規(guī)則推理的商品智能問答模型。
首先,本文設(shè)計了基于LSTM的孿生屬性注意力網(wǎng)絡(luò)(SiameseATT)用于候選屬性選擇,SiameseATT網(wǎng)絡(luò)大大提高了商品智能問答中屬性選擇的性能。其次,我們通過知識圖譜的本體規(guī)則推理,將多跳屬性轉(zhuǎn)換為1跳屬性,解決了復(fù)雜的多跳屬性問答的問題。最后,在NLPCC-ICCPOL 2016問答數(shù)據(jù)集的實驗證明了基于這種孿生屬性注意力網(wǎng)絡(luò)在屬性選擇上比大部分基線模型展現(xiàn)出更好的性能,并且該方法也更適合電商應(yīng)用場景。隨后,本文又利用淘寶網(wǎng)中的家電類商品數(shù)據(jù)構(gòu)建了一個商品智能問答的原型系統(tǒng)。該原型系統(tǒng)展現(xiàn)了通過知識圖譜規(guī)則推理實現(xiàn)動態(tài)生成實體屬性,從而解決了多跳屬性問答的問題。最終,實驗也證明了規(guī)則推理的方法能大大提升問答系統(tǒng)的性能。
2、針對商品搭配推薦中存在的問題,本文提出一種基于知識圖譜的搭配推薦模型,充分利用了電子商務(wù)中商品的標題以及網(wǎng)站中其他可訪問的輔助信息用于提升搭配推薦的性能。
首先,本文根據(jù)商品的購買數(shù)據(jù)和類別信息構(gòu)建了一個名為ItemKG的知識圖譜,接著設(shè)計了TransH的變體來學(xué)習(xí)ItemKG中每個商品和類別的知識圖譜嵌入。另外,根據(jù)在線商品的中文標題的特點,本文開發(fā)了一種標題編碼模型(TEM)來處理中文標題并提取特征向量,隨后構(gòu)建了一個基于深度神經(jīng)網(wǎng)絡(luò)的搭配模型(FIRM),該模型結(jié)合了從ItemKG中學(xué)習(xí)到的商品和類別的知識圖譜嵌入以及通過標題編碼模型而獲得標題向量,用于計算查詢商品和候選商品之間的商品搭配概率。隨后,在真實的電商搭配數(shù)據(jù)集TIANCHI和POG中的實驗表明,該模型性能較基線模型有大幅提升,同時通過消融實驗證明知識圖譜對模型的積極影響。
參考文獻(略)
相關(guān)文章
UKthesis provides an online writing service for all types of academic writing. Check out some of them and don't hesitate to place your order.