期刊VIP學(xué)術(shù)指導(dǎo) 符合學(xué)術(shù)規(guī)范和道德
保障品質(zhì) 保證專業(yè),沒(méi)有后顧之憂
來(lái)源:期刊VIP網(wǎng)所屬分類:應(yīng)用電子技術(shù)時(shí)間:瀏覽:次
摘 要:隨著時(shí)代進(jìn)步,當(dāng)前企業(yè)信息系統(tǒng)普遍面臨的“數(shù)據(jù)爆炸”問(wèn)題,要及時(shí)解決這類問(wèn)題,同時(shí)還要解決“信息缺乏”問(wèn)題,數(shù)據(jù)挖掘技術(shù)成為當(dāng)前學(xué)術(shù)界和企業(yè)界研究的熱點(diǎn)。本篇文章詳細(xì)討論了數(shù)據(jù)挖掘在電子商務(wù)中的數(shù)據(jù)資源、基本方法、體系結(jié)構(gòu)以及典型應(yīng)用。
關(guān)鍵詞:數(shù)據(jù)采集;電子商務(wù)
一、電子商務(wù)中數(shù)據(jù)資源的數(shù)據(jù)挖掘
1.服務(wù)器數(shù)據(jù)
通過(guò)對(duì)此文件中存儲(chǔ)的某些項(xiàng)目進(jìn)行語(yǔ)法分析,例如DNS,就可以知道客戶來(lái)源所在的地區(qū),通過(guò)對(duì)域名www.msta.acjp進(jìn)行分析,就可以知道客戶來(lái)自哪里。在cookielogs中,HTTP協(xié)議本身就是非事務(wù)類型的,這一點(diǎn)在事務(wù)類型的電子商務(wù)中并不適用,這給電子商務(wù)帶來(lái)了很多問(wèn)題。使用cookie可以解決這個(gè)問(wèn)題。Cookie是一個(gè)軟體工件,它可以儲(chǔ)存客戶存取伺服器的資訊,存儲(chǔ)有關(guān)cookie的服務(wù)器軟件的這部分稱為cookielogs。
2.客戶注冊(cè)信息
用戶在網(wǎng)站上的相關(guān)信息,通過(guò)屏幕傳送并進(jìn)入服務(wù)器。在電子商務(wù)活動(dòng)中,電子商務(wù)扮演著非常重要的角色,尤其是關(guān)于安全和限制客戶訪問(wèn)的時(shí)間信息。為了提高數(shù)據(jù)挖掘的精確性和更好地理解客戶,數(shù)據(jù)挖掘需要將客戶注冊(cè)信息集成到訪問(wèn)協(xié)議中[1]。
二、電子商務(wù)環(huán)境下數(shù)據(jù)挖掘的基本方法
1.路徑分析
路徑分析可用于確定訪問(wèn)頻率最高的網(wǎng)站路徑。另外,通過(guò)路徑分析可以得到關(guān)于該路徑的其它信息。舉例來(lái)說(shuō),70%的客戶訪問(wèn)/company/product2,但是用戶會(huì)忽略它們。此外,通常情況下,客戶并未從主頁(yè)訪問(wèn)站點(diǎn),而是從/company/products訪問(wèn),所以最好的方法是在此頁(yè)中包含有關(guān)產(chǎn)品目錄類型的信息。另外還應(yīng)規(guī)定客戶在網(wǎng)站上的停留時(shí)間,因?yàn)轭櫩鸵话阒辉诰W(wǎng)站上瀏覽4個(gè)網(wǎng)頁(yè),所以他們可以把重要的產(chǎn)品信息放在這些網(wǎng)頁(yè)上,利用路徑分析,改善網(wǎng)頁(yè)設(shè)計(jì)和網(wǎng)頁(yè)結(jié)構(gòu)。
2.關(guān)聯(lián)規(guī)則發(fā)現(xiàn)
關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)是在電子商務(wù)中發(fā)現(xiàn)用戶訪問(wèn)網(wǎng)站上各種文檔之間的關(guān)系。國(guó)際人工智能公司這兩個(gè)數(shù)據(jù)中,A【即(1,1,m)】和t【(14,n)】是數(shù)據(jù)庫(kù)中相關(guān)數(shù)據(jù)的一組特征屬性。假如我們使用關(guān)聯(lián)規(guī)則技術(shù),我們可以發(fā)現(xiàn),如果一個(gè)客戶訪問(wèn)某個(gè)頁(yè)面/公司/產(chǎn)品時(shí),他也訪問(wèn)該頁(yè)面/公司/產(chǎn)品2。
3.連續(xù)模式的發(fā)現(xiàn)
連續(xù)模式分析側(cè)重于數(shù)據(jù)之間的前因或因果關(guān)系分析,在順序事務(wù)集中尋找“某些項(xiàng)目跟隨其他項(xiàng)目”的內(nèi)部事務(wù)模式。以/company/producti為例,假如在過(guò)去10天里,有60%的在線訂購(gòu)客戶已經(jīng)購(gòu)買(mǎi)了/company/product2,同時(shí),60%的在線訂購(gòu)計(jì)算機(jī)的客戶將在兩個(gè)月內(nèi)訂購(gòu)打印機(jī)和紙張。通過(guò)這些數(shù)據(jù),商家可以為客戶群體提供更好地針對(duì)性服務(wù)。
4.分類規(guī)則的發(fā)現(xiàn)
分類規(guī)則簡(jiǎn)而言之就是先標(biāo)記每個(gè)記錄,也就是根據(jù)標(biāo)記對(duì)記錄進(jìn)行分類。通過(guò)數(shù)據(jù)挖掘(例如Fazhan/company/productl),假如在網(wǎng)上訂購(gòu)電子商務(wù)產(chǎn)品的客戶中,60%是生活在大中城市的2歲左右的年輕人,經(jīng)過(guò)分類,我們可以根據(jù)這類客戶的特點(diǎn)進(jìn)行經(jīng)營(yíng)活動(dòng),提供針對(duì)性的個(gè)性化信息服務(wù)[2]。
5.聚類分析結(jié)果表明
聚類分析方法的輸入集不同于分類規(guī)則方法的輸入集,聚類分析方法的輸入集是一組未標(biāo)定的記錄集。通過(guò)將有相似瀏覽行為的顧客聚類,使管理者能夠更好地了解顧客,為顧客提供更合適、更滿意的服務(wù)。一些客戶是否經(jīng)常瀏覽相關(guān)信息。在這段時(shí)間里,真實(shí)和電子產(chǎn)品經(jīng)常出現(xiàn),通過(guò)分析,這些顧客都聚集在一個(gè)群體中,我們可以知道這群顧客的需求是什么。服務(wù)對(duì)象要與其他群組客戶區(qū)分開(kāi)來(lái),如“大學(xué)生群體”和“白領(lǐng)群體”。這樣,web就能自動(dòng)將新產(chǎn)品信息電子郵件發(fā)送到這一特定客戶群體,并為這一客戶群體動(dòng)態(tài)地更改專門(mén)網(wǎng)站。從某種程度上說(shuō),滿足客戶需求,對(duì)客戶和銷(xiāo)售者來(lái)說(shuō)更有意義。
三、電子商務(wù)數(shù)據(jù)挖掘的架構(gòu)
因?yàn)殡娮由虅?wù)數(shù)據(jù)挖掘可以把那些復(fù)雜的數(shù)據(jù)以及結(jié)果直接轉(zhuǎn)變成方便理解的信息,因此,要真正發(fā)揮電子商務(wù)的效率,除了要充分利用和合理選擇前面提到的基本方法以及常用的工具外,還必須將辦公處理階段的數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)中,并與電子商務(wù)行為有機(jī)地結(jié)合起來(lái),通過(guò)圖片可以看出,在電子商務(wù)中,數(shù)據(jù)挖掘的體系結(jié)構(gòu)是由商務(wù)數(shù)據(jù)的定義、客戶交互以及分析處理三個(gè)主要部分組成的。
1.企業(yè)數(shù)據(jù)定義
本節(jié)中,客戶會(huì)通過(guò)自身需求來(lái)給出數(shù)據(jù)。這些數(shù)據(jù)包括了很多內(nèi)容,如商品信息(產(chǎn)品、產(chǎn)品分類、價(jià)格)、內(nèi)容信息(網(wǎng)頁(yè)圖片和多媒體)以及活動(dòng),這些都是收集和處理數(shù)據(jù)的關(guān)鍵因素。
2.顧客互動(dòng)
本節(jié)介紹顧客與電子商務(wù)的互動(dòng)行為,這種互動(dòng)可能發(fā)生在網(wǎng)站的許多領(lǐng)域,例如客戶服務(wù)和交流應(yīng)用程序。為有效地挖掘這些數(shù)據(jù)源,數(shù)據(jù)收集不只是銷(xiāo)售記錄數(shù)據(jù),還包括其他客戶行為、網(wǎng)站瀏覽網(wǎng)頁(yè)等。
3.分析與處理
此環(huán)節(jié)運(yùn)用了大數(shù)據(jù)的統(tǒng)計(jì)、數(shù)據(jù)挖掘算法、可視化工具和OLAP工具,建立了交互決策支持環(huán)境,該部分是系統(tǒng)的最后一部分。
四、數(shù)據(jù)挖掘技術(shù)的應(yīng)用
1.尋找潛在客戶
潛在客戶的挖掘第一步則是對(duì)客戶群體進(jìn)行分類,有“visitorOlace”和“visitoregular”,對(duì)商家來(lái)說(shuō),從網(wǎng)絡(luò)上的分類中可以看出,通過(guò)對(duì)已被分類的客戶和老客戶的部分公共描述,新客戶被準(zhǔn)確地分類,新客戶分類之后要對(duì)他們進(jìn)行判斷,即判斷他們是有興趣還是無(wú)興趣的客戶群,決定新客戶是否是潛在客戶,一旦確定了客戶的類型,就可以向客戶展示網(wǎng)頁(yè)的內(nèi)容,而網(wǎng)頁(yè)的內(nèi)容則是客戶與銷(xiāo)售商之間的關(guān)系,取決于所提供產(chǎn)品和服務(wù)的相關(guān)規(guī)則。
使用這些規(guī)則,對(duì)于新客戶來(lái)說(shuō),需要花一些時(shí)間瀏覽市場(chǎng)網(wǎng)站,如果來(lái)自于上面的域名jp或m,那么該客戶可以被看作是潛在客戶,接下來(lái)只需要向其顯示關(guān)于jp或Ils的頁(yè)面內(nèi)容即可[3]。
2.改善網(wǎng)站設(shè)計(jì)
網(wǎng)頁(yè)內(nèi)容的排列和連接方式就像超市貨架上的商品。將相關(guān)文章組合起來(lái),給予一定的支持和信任,有助于銷(xiāo)售人員發(fā)現(xiàn)因特網(wǎng)上的關(guān)聯(lián)規(guī)則,從而動(dòng)態(tài)地適應(yīng)客戶網(wǎng)站的結(jié)構(gòu),使客戶能夠訪問(wèn)的連接文件之間的連接更加直接,客戶可以輕松地訪問(wèn)他們可能訪問(wèn)的頁(yè)面,如果網(wǎng)站非常方便瀏覽,就可以給客戶留下好的印象,增加下次訪問(wèn)的可能性。
3.客戶群
客戶群為e-商業(yè)型。分析這類顧客的共同特點(diǎn),電子商務(wù)組織方就能更好地了解他們的顧客,為顧客提供更加適合他們的服務(wù)。假如有些客戶花些時(shí)間在“嬰兒玩具”和“嬰兒退貨”頁(yè)面上進(jìn)行分析,把這些客戶組合起來(lái),根據(jù)收集到的信息,銷(xiāo)售者可能知道這是一個(gè)“準(zhǔn)父母”客戶。因此要及時(shí)調(diào)整頁(yè)面和頁(yè)面內(nèi)容,使商業(yè)活動(dòng)與客戶需求保持一致,讓商業(yè)活動(dòng)對(duì)客戶和銷(xiāo)售商更有意義。
五、結(jié)束語(yǔ)
在機(jī)器學(xué)習(xí)的基礎(chǔ)上發(fā)展起來(lái)的數(shù)據(jù)挖掘技術(shù),雖然已經(jīng)有十幾年的歷史,但是在實(shí)際應(yīng)用中還存在著許多問(wèn)題,主要是系統(tǒng)結(jié)構(gòu)和典型應(yīng)用方面的問(wèn)題,但是在電子商務(wù)環(huán)境下,數(shù)據(jù)挖掘技術(shù)仍存在著許多亟待解決的問(wèn)題。比如,在不同國(guó)家或地區(qū)存儲(chǔ)網(wǎng)絡(luò)數(shù)據(jù)的不一致性,以及利用數(shù)據(jù)挖掘技術(shù),利用動(dòng)態(tài)數(shù)據(jù)庫(kù)、對(duì)象數(shù)據(jù)庫(kù)、多媒體等,另外還要進(jìn)行抽取規(guī)則的準(zhǔn)確性和時(shí)效性,數(shù)據(jù)的安全性,隱私性等方面的研究。
參考文獻(xiàn)
[1] 劉紹君,劉宇為.數(shù)據(jù)挖掘技術(shù)在校園電子商務(wù)中的應(yīng)用探索[J].南方農(nóng)機(jī),2020,v.51;No.348(08):217+226.
[2] 高艷敏.分析數(shù)據(jù)挖掘技術(shù)運(yùn)用于電子商務(wù)中的對(duì)策[J].電子世界,2020(15).
[3] 趙書(shū)慧.電商市場(chǎng)中大數(shù)據(jù)挖掘的分析以及決策探究[J].中國(guó)新通信,2020(12