電子商務中web數據挖掘的應用_web挖掘怎麼實現

A. 企業如何應用數據挖掘提高企業競爭力

企業應該將數據挖掘視為一大法寶，利用它將數據轉化為商業智能，提高企業的核心競爭力。數據激增是當今社會的一大特性，如何有效的利用數據挖掘方法，從海量信息中提取出有用的模式和規律而不僅僅是「望洋興嘆」，已經成為人們迫切的需求。從投資的角度來看，如果對數據研究所支付的費用少於研究成果所帶來的價值，數據挖掘就值得去做。正如修行的省悟過程一樣，要將數據挖掘引入公司，並非只有一種途徑。我們的最終目的是解決企業的業務問題，為企業提供更大的商機。想要將數據挖掘有效應用到企業主要有四個途徑：1、購買成熟的模型；2、使用行業應用軟體；3、聘請專家實施項目；4、量身定做開發自己的數據挖掘平台。

想要學習了解更多數據挖掘的信息，推薦CDA數據分析師課程。CDA數據分析師系列叢書滿足了CDA數據分析師等級認證的學習需要，也兼顧了大數據的熱點動態。學員掌握的技能知識可以快速轉化為自身能夠靈活應用的技能，在面對不同場景時自由發揮。點擊預約免費試聽課。

B. 數據挖掘的應用現狀

數據挖掘的應用現狀
數據挖掘所要處理的問題，就是在龐大的資料庫中找出有價值的隱藏事件，並且加以分析，獲取有意義的信息，歸納出有用的結構，作為企業進行決策的依據。其應用非常廣泛，只要該產業有分析價值與需求的資料庫，皆可利用數據挖掘（DM）技術進行有目的的發掘分析。
常見的應用案例多發生在零售業、財務金融保險、製造業、通訊及醫療服務行業：
1、零售商從顧客購買商品中發現一定的關系，提供打折購物券等，提高銷售額；
2、保險公司通過數據挖掘建立預測模型，辨別出可能的欺詐行為，避免道德風險，減少成本，提高利潤；
3、在製造業中，半導體的生產和測試中都產生大量的數據，就必須對這些數據進行分析，找出存在的問題，提高質量；
4、電子商務的作用越來越大，可以用數據挖掘對網站進行分析，識別用戶的行為模式，保留客戶，提供個性化服務，優化網站設計。

C. web挖掘怎麼實現

截止到今天為止，我尚不知道有什麼有價值的web挖掘系統存在，不過您可以參考檢索引擎的挖掘演算法，比如Apache的lucene等

http://lucene.apache.org/java/docs/index.html

-------------
並為您附錄以下信息：

近年來，隨著 Internet/Web技術的快速普及和迅猛發展，使各種信息可以以非常低的成本在網路上獲得，由於Internet/WWW在全球互連互通，可以從中取得的數據量難以計算，而且Internet/WWW的發展趨勢繼續看好，特別是電子商務的蓬勃發展為網路應用提供了強大支持，如何在WWW這個全球最大的數據集合中發現有用信息無疑將成為數據挖掘研究的熱點。
Web挖掘指使用數據挖掘技術在WWW數據中發現潛在的、有用的模式或信息。Web挖掘研究覆蓋了多個研究領域，包括資料庫技術、信息獲取技術、統計學、人工智慧中的機器學習和神經網路等。
2．Web挖掘流程
與傳統數據和數據倉庫相比，Web上的信息是非結構化或半結構化的、動態的、並且是容易造成混淆的，所以很難直接以Web網頁上的數據進行數據挖掘，而必須經過必要的數據處理。典型Web挖掘的處理流程如下[3]：
1．查找資源：任務是從目標Web文檔中得到數據，值得注意的是有時信息資源不僅限於在線Web文檔，還包括電子郵件、電子文檔、新聞組，或者網站的日誌數據甚至是通過Web形成的交易資料庫中的數據。
2．信息選擇和預處理：任務是從取得的Web資源中剔除無用信息和將信息進行必要的整理。例如從Web文檔中自動去除廣告連接、去除多餘格式標記、自動識別段落或者欄位並將數據組織成規整的邏輯形式甚至是關系表。
3．模式發現：自動進行模式發現。可以在同一個站點內部或在多個站點之間進行。
4．模式分析：驗證、解釋上一步驟產生的模式。可以是機器自動完成，也可以是與分析人員進行交互來完成。
Web挖掘作為一個完整的技術體系，在進行挖掘之前的信息獲得IR（Information Retrieval）和信息抽取IE(Information Extraction)相當重要。信息獲得（IR）的目的在於找到相關Web文檔，它只是把文檔中的數據看成未經排序的片語的集合，而信息抽取(IE)的目的在於從文檔中找到需要的數據項目，它對文檔的結構合表達的含義感興趣,它得一個重要任務就是對數據進行組織整理並適當建立索引。
信息獲得（IR）和信息抽取(IE)技術的研究已近有很長時間，隨著Web技術的發展，基於Web技術的IR、 IE得到了更多的重視。由於Web 數據量非常大，而且可能動態變化，用原來手工方式進行信息收集早已經力不從心，目前的研究方向是用自動化、半自動化的方法在Web上進行IR和IE。在 Web環境下既要處理非結構化文檔，又要處理半結構化的數據，最近幾年在這兩方面都有相應的研究成果和具體應用，特別是在大型搜索引擎中得到了很好的應用。
3．Web挖掘分類及各自的研究現狀及發展
根據對Web數據的感興趣程度不同，Web挖掘一般可以分為三類：Web內容挖掘（Web Content mining）、 Web結構挖掘（ Web structure mining）、 Web 用法挖掘（Web usage Mining）
3．1、Web內容挖掘：
指從Web內容/數據/文檔中發現有用信息，Web上的信息五花八門，傳統的Internet由各種類型的服務和數據源組成，包括WWW、FTP、Telnet等，現在有更多的數據和埠可以使用，比如政府信息服務、數字圖書館、電子商務數據，以及其他各種通過 Web可以訪問的資料庫。Web內容挖掘的對象包括文本、圖象、音頻、視頻、多媒體和其他各種類型的數據。其中針對無結構化文本進行的Web挖掘被歸類到基於文本的知識發現（KDT）領域，也稱文本數據挖掘或文本挖掘，是Web挖掘中比較重要的技術領域，也引起了許多研究者的關注。最近在Web多媒體數據挖掘方面的研究成為另一個熱點。
Web內容挖掘一般從兩個不同的觀點來進行研究。從資源查找（IR）的觀點來看，Web內容挖掘的任務是從用戶的角度出發，怎樣提高信息質量和幫助用戶過濾信息。而從DB的角度講Web內容挖掘的任務主要是試圖對Web上的數據進行集成、建模，以支持對Web數據的復雜查詢。
3．1．1從資源查找（Information Retrival）的觀點挖掘非結構化文檔：
非結構化文檔主要指Web上的自由文本，包括小說、新聞等。在這方面的研究相對比較多一些，大部分研究都是建立在詞彙袋（bag of words）或稱向量表示法（vector representation）的基礎上，這種方法將單個的詞彙看成文檔集合中的屬性，只從統計的角度將詞彙孤立地看待而忽略該詞彙出現的位置和上下文環境。屬性可以是布爾型，根據詞彙是否在文檔中出現而定，也可以有頻度，即該詞彙在文檔中的出現頻率。這種方法可以擴展為選擇終結符、標點符號、不常用詞彙的屬性作為考察集合。詞彙袋方法的一個弊端是自由文本中的數據豐富，詞彙量非常大，處理起來很困難，為解決這個問題人們做了相應的研究，採取了不同技術，如信息增益，交叉熵、差異比等，其目的都是為了減少屬性。另外，一個比較有意義的方法是潛在語義索引（Latent Semantic Indexing），它通過分析不同文檔中相同主題的共享詞彙，找到他們共同的根，用這個公共的根代替所有詞彙，以此來減少維空間。例如：「informing」、「information」、「informer」、「informed」可以用他們的根「inform」來表示，這樣可以減少屬性集合的規模。
其他的屬性表示法還有詞彙在文檔中的出現位置、層次關系、使用短語、使用術語、命名實體等，目前還沒有研究表明一種表示法明顯優於另一種。
用資源查找（Information Retrival）的觀點挖掘半結構化文檔：
與非結構化數據相比，Web上的半結構化文檔挖掘指在加入了HTML、超連接等附加結構的信息上進行挖掘，其應用包括超連接文本的分類、聚類、發現文檔之間的關系、提出半結構化文檔中的模式和規則等。
3．1．2從資料庫（Database）的觀點挖掘非結構化文檔：
資料庫技術應用於Web挖掘主要是為了解決Web信息的管理和查詢問題。這些問題可以分為三類：Web信息的建模和查詢；信息抽取與集成；Web站點建構和重構。
從資料庫的觀點進行Web內容挖掘主要是試圖建立Web站點的數據模型並加以集成，以支持復雜查詢，而不止是簡單的基於關鍵詞的搜索。這要通過找到Web文檔的模式、建立Web數據倉庫或Web知識庫或虛擬資料庫來實現。相關研究主要是基於半結構化數據進行的。
資料庫觀點主要利用OEM(Object Exchange Model)模型將半結構化數據表示成標識圖。OEM中的每個對象都有對象標識（OID）和值，值可以是原子類型，如整型、字元串型、gif、html 等，也可以是一個復合類型，以對象引用集合的形式表示。由於Web數據量非常龐大，從應用的角度考慮，很多研究只處理辦結構化數據的一個常用自集。一些有意義的應用是建立多層資料庫（MLDB），每一層是它下面層次的概化，這樣就可以進行一些特殊的查詢和信息處理。對於在半結構化數據上的查詢語言研究也得到了人們的重視並做了專題研究。
由於在資料庫觀點下數據的表示方法比較特殊，其中包含了關系層次和圖形化的數據，所以大部分建立在扁平數據集合之上的數據挖掘方法不能直接使用，目前已經有人針對多層資料庫挖掘演算法進行研究。
3．2、Web結構挖掘：
Web結構挖掘的對象是Web本身的超連接，即對Web文檔的結構進行挖掘。對於給定的Web文檔集合，應該能夠通過演算法發現他們之間連接情況的有用信息，文檔之間的超連接反映了文檔之間的包含、引用或者從屬關系，引用文檔對被引用文檔的說明往往更客觀、更概括、更准確。
Web結構挖掘在一定程度上得益於社會網路和引用分析的研究。把網頁之間的關系分為incoming連接和 outgoing連接，運用引用分析方法找到同一網站內部以及不同網站之間的連接關系。在Web結構挖掘領域最著名的演算法是HITS演算法和 PageRank演算法。他們的共同點是使用一定方法計算Web頁面之間超連接的質量，從而得到頁面的權重。著名的Clever和Google搜索引擎就採用了該類演算法。
此外，Web結構挖掘另一個嘗試是在Web數據倉庫環境下的挖掘，包括通過檢查同一台伺服器上的本地連接衡量 Web結構挖掘Web站點的完全性，在不同的Web數據倉庫中檢查副本以幫助定位鏡像站點，通過發現針對某一特定領域超連接的層次屬性去探索信息流動如何影響Web站點的設計。
3．3、Web用法挖掘（Web usage Mining）：
即Web使用記錄挖掘，在新興的電子商務領域有重要意義，它通過挖掘相關的Web日誌記錄，來發現用戶訪問 Web頁面的模式，通過分析日誌記錄中的規律，可以識別用戶的忠實度、喜好、滿意度，可以發現潛在用戶，增強站點的服務競爭力。Web使用記錄數據除了伺服器的日誌記錄外還包括代理伺服器日誌、瀏覽器端日誌、注冊信息、用戶會話信息、交易信息、Cookie中的信息、用戶查詢、滑鼠點擊流等一切用戶與站點之間可能的交互記錄。可見Web使用記錄的數據量是非常巨大的，而且數據類型也相當豐富。根據對數據源的不同處理方法，Web 用法挖掘可以分為兩類，一類是將Web使用記錄的數據轉換並傳遞進傳統的關系表裡，再使用數據挖掘演算法對關系表中的數據進行常規挖掘；另一類是將Web 使用記錄的數據直接預處理再進行挖掘。Web 用法挖掘中的一個有趣的問題是在多個用戶使用同一個代理伺服器的環境下如何標識某個用戶，如何識別屬於該用戶的會話和使用記錄，這個問題看起來不大，但卻在很大程度上影響著挖掘質量，所以有人專門在這方面進行了研究。通常來講，經典的數據挖掘演算法都可以直接用到Web 用法挖掘上來，但為了提高挖掘質量，研究人員在擴展演算法上進行了努力，包括復合關聯規則演算法、改進的序列發現演算法等。
在[4]中，根據數據來源、數據類型、數據集合中的用戶數量、數據集合中的伺服器數量等將Web 用法挖掘分為五類：
●個性挖掘：針對單個用戶的使用記錄對該用戶進行建模，結合該用戶基本信息分析他的使用習慣、個人喜好，目的是在電子商務環境下為該用戶提供與眾不同的個性化服務。
●系統改進：Web服務（資料庫、網路等）的性能和其他服務質量是衡量用戶滿意度的關鍵指標，Web 用法挖掘可以通過用戶的擁塞記錄發現站點的性能瓶頸，以提示站點管理者改進Web緩存策略、網路傳輸策略、流量負載平衡機制和數據的分布策略。此外，可以通過分析網路的非法入侵數據找到系統弱點，提高站點安全性，這在電子商務環境下尤為重要。
●站點修改：站點的結構和內容是吸引用戶的關鍵。Web 用法挖掘通過挖掘用戶的行為記錄和反饋情況為站點設計者提供改進的依，比如頁面連接情況應如何組織、那些頁面應能夠直接訪問等。
●智能商務：用戶怎樣使用Web站點的信息無疑是電子商務銷售商關心的重點，用戶一次訪問的周期可分為被吸引、駐留、購買和離開四個步驟，Web用法挖掘可以通過分析用戶點擊流等Web日誌信息挖掘用戶行為的動機，以幫助銷售商合理安排銷售策略。
●Web特徵描述：這類研究跟關注這樣通過用戶對站點的訪問情況統計各個用戶在頁面上的交互情況，對用戶訪問情況進行特徵描述。
4．結束語
盡管Web挖掘的形式和研究方向層出不窮，但我認為隨著電子商務的興起和迅猛發展，未來Web挖掘的一個重要應用方向將是電子商務系統。而與電子商務關系最為密切的是用法挖掘（Usage Mining），也就是說在這個領域將會持續得到更多的重視。另外，在搜索引擎的研究方面，結構挖掘的研究已經相對成熟，基於文本的內容挖掘也已經有許多研究，下一步將會有更多的研究者把多媒體挖掘最為研究方向。

D. web數據挖掘技術在電子商務中有哪些應用

數據挖掘在電子商務中主要應用於數據分析，區別於傳統的資料庫，只進行簡單的查詢功能，數據挖掘對過往數據進行分析得到在電子商務所需要的數據

E. html技術與web技術在電子商務中所起的作用是什麼

最佳答案檢舉隱藏計算機技術對電子商務的作用

電子商務是指通過互聯網完成的商務交易。作為依託互聯網發展起來的商業運作模式,與傳統商業比較給人們曾帶來過很多欣喜，但是隨著電子商務交易的不斷發展，暴露出了一些技術問題，如EDI（Electronic Data Interchange）中的問題等，使電子商務一度陷入舉步為艱的地步。
一、EDI在電子商務中的應用
聯合國EDIFACT培訓指南認為：「EDI指的是在最少的人工干預下，在貿易夥伴的計算機應用系統之間的標准格式數據的交換」。 EDI主要由UN/EDIFACT的基礎標准體系和開放式EDI基礎標准兩部分組成。它是EDI的核心標准體系。EDI主要是為完成企業間的數據交換而產生和應用的。雖然EDI的應用使企業之間大大減少了在交易中的時間、效率上的開銷，但是傳統的EDI卻仍然存在不少的缺陷：
1.實現EDI的成本過於昂貴
EDI通信方式有兩種：一種是在貿易夥伴之間建立專用網；另一種是增值網路(VAN)方式，建立專用網的費用是不言而喻的，而VAN是一套私有網路，它的租用、維護費用也是很昂貴的。對於中小型企業來說，這兩種方式的費用都是很難承受的。有數據顯示：全球使用EDI進行電子商務的企業98%來自世界前1000強。這樣也就限制了中小型企業加入到電子商務行列中的步伐，並有礙於電子商務全球化的進程。
2.EDI標准結構的靈活性較差
EDI使用的是一套預先定義好的報文標准，在與其他企業集成時不能隨業務環境的變化而進行自動的調整。這些不利於企業業務的發展。
3.EDI不能通過構建Web Service來跨越多個應用程序和供應商進行通信
在Web Service持續發展的今天，越來越多企業認識到了Web Service的巨大潛力,開始把它運用到他們的組織中，可是原有的EDI技術模式使企業無法利用EDI去實現這一目標。
4.EDI難以實現電子商務中的數據挖掘
EDI主要通過單證傳遞來完成企業之間信息交流，現在的電子商務已經不僅僅是停留在數據的傳遞上，而且要通過Web收集大量的、各種商業數據來進行數據挖掘，從中得到有利於企業戰略決策的信息。
二、XML在電子商務中的應用
1.XML的簡介
XML（eXtensible Markup Language）是W3C於1998年2月發布的一種標准，它是SGML的簡化子集，將SGML的功能和HTML的易用性結合到Web的應用中，以一種開放的自我描述方式定義數據結構，在描述數據內容的同時能突出對結構的描述，從而體現出數據之間的關系。
2.XML的特點
(1)XML成為不同格式數據向標准化格式數據轉換的「橋梁」。由於處於Web中的電子商務，其中涉及的很多數據源都是異構的，XML在各種數據源之間建立了一個數據格式的中間標准，利用XML中的XSLT技術實現了不同格式的數據與XML文檔之間的雙向轉換與傳輸，並方便地進行Web應用。
(2)文檔管理功能。XML中的XLL（eXtensible Linkage Language）技術是表示XML文檔之間的鏈接方法，XLL與HTML中的超鏈接相似，但功能更強，例如可以鏈接文檔的特定部分。此方法使文檔更易於檢索等，也可以使很多公司從海洋一樣的文書工作中解脫出來。
(3)XML可以成為信息存儲和管理的方式。XML可以很輕松地完成與很多類型的企業資料庫的交互操作，例如從SQL查詢中檢索XML數據以及修改XML數據記錄。這就使XML如同傳統的資料庫技術一樣，易於操作。
(4)XML可以完成企業之間業務數據的傳輸。各種業務數據是以XML格式在企業之間傳輸。與EDI相比，不僅可以完成從一種票據格式到另一種票據格式的轉換，還有多種企業需要的基於票據各種操作，而且過程簡單、快捷，成本低廉。
(5)可以完成基於Web的數據挖掘。主要分為數據挖掘和挖掘表示兩個部分。數據挖掘就是利用合適的挖掘演算法和已有的知識庫知識對統一的XML 文檔進行數據提取,可以採用諸如特徵抽取、關聯分析、屬性分類、聚類分析等方法實現。挖掘表示是指對挖掘出的Web 數據經過模式評估和解釋用適當的形式表現出來,例如圖形，以便於用戶理解和使用。

3.XML的缺點
雖然XML很好地解決了EDI技術中的一些缺陷，並且XML已經成為Internet上數據交換事實上的標准。主要基於它的優點：擴展性、自描述性、系統無關性、健壯性、形式與內容分離等。但通過實踐證明，它仍然不能構建Web服務來跨越多個應用程序和供應商進行通信。這也就促成了ebXML的誕生。
EML-EDI在電子商務中的應用：如果基於XML技術的諸多優點，而直接用它來完全替代原來的EDI，顯然會給企業帶來多方面的不利，比如：資金上、技術上等的影響。因此，產生了過度技術模式——XML-EDI。在EML-EDI的模式中，為了保護原有投資，大企業之間依舊採用原有的EDI系統，採用EDI/VAN交換數據。
ebXML在電子商務中的應用:ebXML是由UN/CEFACT和OASIS 兩家組織發起和制定的一個規范集, 這些規范共同實現了模塊化電子商務框架。ebXML的目標是實現跨行業的B2B、B2C商業貿易，甚至全球性的電子商務市場,使得不同規模和不同地區的企業可以通過交換基於XML格式的消息來合作和進行商業活動。
ebXML體系架構由許多部分組成,其主要有:
（1）消息服務:消息組成了商業夥伴間的交易對話,是商務過程的基礎。ebXML可以創建各種類型的消息,對各種消息提供支持,以確保安全可靠的交換有效負載。
(2)注冊庫或知識庫:是ebXML 體系結構的核心,用來注冊和存儲商業流程和商業信息模型等,它使得ebXML工作所需要的各種數據能夠統一存放,以便復用和保持一致性。
(3)貿易夥伴信息:描述貿易夥伴參與貿易活動所必須的信息,也是雙方進行電子商務的技術細節,包含貿易夥伴個人信息CPP 和CPP 基礎上雙方協商出來的CPA。
(4)商務流程規范:ebXML是建立在商務流程建模的基礎上,ebXML規范體系集中包含著定義描述商務流程和信息模型的標准機制BPSS（Business Process Specification Schema）,是企業雙方進行電子商務的商業細節。當企業要進行電子商務並決定採用ebXML 框架時,首先通過在注冊庫中查找,找到符合自己條件的商業模型,並下載ebXML的技術規范；然後按照該規范在本地系統上構建ebXML的應用實現,並創建一個合作夥伴概要CPP來描述企業系統的實現細節和提供的功能信息服務,可以加入新的商務流程,也可以只是引用已有的流程,隨後將其注冊到注冊中心。這樣其他採用ebXML標準的企業就可以通過注冊庫查找該企業的CPP,雙方系統在CPP的基礎上自動協商,最終達成CPA等交互協議約定,以後雙方便在此基礎上進行交易。
電子商務經歷了以上三種主要的、一種過度的計算機技術的發展，逐步走向完善。另外，從中我們可以看到，ebXML的開放性以及接納現有標准和方法的做法,使得它很易於被人們接受 ,而且ebXML 允許商家以不同的方式進行商業活動,因此具有更廣泛的市場和應用前景。
參考文獻：
[1]宋沛軍:電子商務概論[M].西安：西安電子科技大學出版社，2005
[2]陳堯妃倪應華:基於XML個性化數據挖掘框架設計[J].現代電子技術，2007 No.2
[3]沈世銘尹紹宏:基於XML在異構數據之間轉換的研究[J].儀器儀表用戶， 2007 No.1
[4]ebXML overview,http://ebXML.xml.org/overview.
[5]郝萍饒若楠:一種基於MDA 的ebXML[J].計算機應用與軟體,2005 No.3

F. 數據挖掘的應用領域有哪些

數據挖掘的應用領域非常廣泛，目前來說在零售業、製造業、財務金融保險、通訊及醫療服務、電信、零售、農業、電力、生物、天體、化工等方面，未來將會應用在更多的領域之中。

近年來，數據挖掘引起了信息產業界的極大關注，一般只要該產業有分析價值需求的資料庫，就可以利用數據挖掘工具進行有目的的對比分析，再將這些數據轉換成有用的信息和知識。獲取的信息和知識可以廣泛用於各種應用，包括市場分析、生產控制、醫療服務、工程設計和科學探索等。比如某商場從顧客購買商品中發現一定的關聯規則，可以提供打折、購物券等促銷手段，提高銷售額；某醫院內部醫療器具的管理、病人檔案資料整理等工作，引進數據挖掘技術，能夠深入分析疾病之間的聯系及規律，幫助醫生診斷和治療，以達到診斷事半功倍的目標，且為保障人類健康等提供強大的技術支持。諸如此類的應用，還有很多。

了解數據挖掘的應用領域，推薦上CDA數據分析師的課程。課程內容兼顧培養解決數據挖掘流程問題的橫向能力以及解決數據挖掘演算法問題的縱向能力。要求學生具備從數據治理根源出發的思維，通過數字化工作方法來探查業務問題，通過近因分析、宏觀根因分析等手段，再選擇業務流程優化工具還是演算法工具，而非「遇到問題調演算法包」。真正理解商業思維，項目思維，能夠遇到問題解決問題。點擊預約免費試聽課。

G. 舉例說明數據挖掘技術可以應用於市場營銷做什麼

數據挖掘技術應用於企業市場營銷，是以市場營銷學生物市場細分及消費者行為分析原理為基礎，通過加工、處理、分析涉及消費者消費行為的大量信息，確定特定消費群體或個體的興趣、消費習慣、消費傾向和消費需求，以及相關環境發生變化可能性幾率，就可以推斷出相應消費群體或個體下一步的消費行為，然後以此為基礎，對所識別出來的消費群體進行特定內容定向營銷，這與傳統的不區分消費者對象特徵的大規模營銷手段相比，不僅大大節省了營銷成本，提高了營銷效果，而且能防範營銷風險，從而為企業帶來更多的利潤。在市場營銷中利用數據挖掘技術可以解決的問題有：識別有價值的顧客及他們的性格特徵，預測消費者的購買行為，顧客流失分析，評估廣告效果，評估及劃分信用風險，評估潛在消費者交叉銷售和向上銷售直接目標銷售，欺詐發現關於環境變化的狀態參數及可能性概率。

想要學習了解更多數據挖掘的信息，推薦CDA數據分析師課程。CDA認證考試由經管之家主辦，該課程要求學生根據業務場景來綜合判斷，洞察數據規律，使用正確的數據清洗與特徵工程方法，綜合使用統計分析方法、統計模型、運籌學、機器學習、文本挖掘演算法，而非單一的機器學習演算法。點擊預約免費試聽課。

H. 國內的數據挖掘，大數據應用的案例有哪些

國內數據挖掘，大數據運用主要有以下幾類：
1、電子商務的推薦系統。基本都是基於協同過濾的推薦系統：背後的演算法是基於內容、基於用戶行為、基於產品等。
2、另外一個可以就是對網路用戶行為分析。來分析用戶在網站的點擊行為。從而為產品設計、改進產品提供指導。
3、當然目前很流行就是文本挖掘，因為以前都是點擊流數據，對於用戶評論的文字信息，提煉的很少，主要用Google、垂直搜索引擎會用到排序之類的。
如果說有一家科技公司准確定義了「大數據」概念的話，那一定是谷歌。根據搜索研究公司comScore的數據，僅2012年3月一個月的時間，谷歌處理的搜索詞條數量就高達122億條。谷歌的體量和規模，使它擁有比其他大多數企業更多的應用大數據的途徑。

想要了解更多關於大數據挖掘的相關內容，推薦CDA數據分析師課程。課程內容兼顧培養解決數據挖掘流程問題的橫向能力以及解決數據挖掘演算法問題的縱向能力。真正理解商業思維，項目思維，能夠遇到問題解決問題；要求學生在使用演算法解決微觀根因分析、預測分析的問題上，根據業務場景來綜合判斷，洞察數據規律，使用正確的數據清洗與特徵工程方法，綜合使用統計分析方法、統計模型、運籌學、機器學習、文本挖掘演算法，而非單一的機器學習演算法。點擊預約免費試聽課

I. 目前，數據挖掘技術在我們身邊的具體應用有哪些大家可以在線交流交流......

數據挖掘系統的其它應用還有：
♦ 在對客戶進行分析方面：銀行信用卡和保險行業，利用數據挖掘將市場分
成有意義的群組和部門，從而協助市場經理和業務執行人員更好地集中於
有促進作用的活動和設計新的市場運動。
♦ 在客戶關系管理方面：數據挖掘能找出產品使用模式或協助了解客戶行為，
從而可以改進通道管理（如銀行分支和6等）。又如正確時間銷售就是基於顧客生活周期模型來實施的。
♦ 在零售業方面：數據挖掘用於顧客購貨籃的分析可以協助貨架布置，促銷活動時間，促銷商品組合以及了解滯銷和暢銷商品狀況等商業活動。通過
對一種廠家商品在各連鎖店的市場共享分析，客戶統計以及歷史狀況的分
析，可以確定銷售和廣告業務的有效性。
♦ 在產品質量保證方面：數據挖掘協助管理大數量變數之間的相互作用，並
能自動發現出某些不正常的數據分布，揭示製造和裝配操作過程中變化情
況和各種因素，從而協助質量工程師很快地注意到問題發生范圍和採取改
正措施。
♦ 在遠程通訊方面：基於數據挖掘的分析協助組織策略變更以適應外部世界
的變化，確定市場變化模式以指導銷售計劃。在網路容量利用方面，數據
挖掘能提供對客戶聚集服務使用的結構和模式的了解，從而指導容量計劃
人員對網路設施作出最佳投資決策。
♦ 在各個企事業部門，數據挖掘在假偽檢測及險災評估、失誤迴避、資源分
配、市場銷售預測廣告投資等很多方面，起著很重要作用。例如在化學及
制葯行業，將數據挖掘用於巨量生物信息可以發現新的有用化學成分；在遙感領域針對每天從衛星上及其它方面來的巨額數據，對氣象預報、臭氧
層監測等能起很大作用。

J. 如何通過用數據挖掘技術來分析Web網站日誌

1、數據預處理階段根據挖掘的目的，對原始Web日誌文件中的數據進行提取、分解、合並、最後轉換為用戶會話文件。該階段是Web訪問信息挖掘最關鍵的階段，數據預處理包括:關於用戶訪問信息的預處理、關於內容和結構的預處理。

2、會話識別階段該階段本是屬於數據預處理階段中的一部分，這里將其劃分成單獨的一個階段，是因為把用戶會話文件劃分成的一組組用戶會話序列將直接用於挖掘演算法，它的精準度直接決定了挖掘結果的好壞，是挖掘過程中最重要的階段。

3、模式發現階段模式發現是運用各種方法和技術從Web日誌數據中挖掘和發現用戶使用Web的各種潛在的規律和模式。模式發現使用的演算法和方法不僅僅來自數據挖掘領域，還包括機器學習、統計學和模式識別等其他專業領域。

模式發現的主要技術有：統計分析（statistical analysis）、關聯規則（association rules）、聚類（clustering）、歸類（classification）、序列模式（sequential patterns）、依賴關系（dependency）。

（1）統計分析（statistical analysis）：常用的統計技術有：貝葉斯定理、預測回歸、對數回歸、對數-線性回歸等。可用來分析網頁的訪問頻率，網頁的訪問時間、訪問路徑。可用於系統性能分析、發現安全漏洞、為網站修改、市場決策提供支持。

（2）關聯規則（association rules）：關聯規則是最基本的挖掘技術，同時也是WUM最常用的方法。在WUM中常常用在被訪問的網頁中，這有利於優化網站組織、網站設計者、網站內容管理者和市場分析，通過市場分析可以知道哪些商品被頻繁購買，哪些顧客是潛在顧客。

（3）聚類（clustering）：聚類技術是在海量數據中尋找彼此相似對象組，這些數據基於距離函數求出對象組之間的相似度。在WUM中可以把具有相似模式的用戶分成組，可以用於電子商務中市場分片和為用戶提供個性化服務。

（4）歸類（classification）：歸類技術主要用途是將用戶資料歸入某一特定類中，它與機器學習關系很緊密。可以用的技術有：決策樹（decision tree）、K-最近鄰居、Naïve Bayesian classifiers、支持向量機（support vector machines）。

（5）序列模式（sequential patterns）：給定一個由不同序列組成的集合，其中，每個序列由不同的元素按順序有序排列，每個元素由不同項目組成，同時給定一個用戶指定的最小支持度閾值，序列模式挖掘就是找出所有的頻繁子序列，即子序列在序列集中的出現頻率不低於用戶指定的最小支持度閾值。

（6）依賴關系（dependency）：一個依賴關系存在於兩個元素之間，如果一個元素A的值可以推出另一個元素B的值，則B依賴於A。

4、模式分析階段模式分析是Web使用挖掘最後一步，主要目的是過濾模式發現階段產生的規則和模式，去除那些無用的模式，並把發現的模式通過一定的方法直觀的表現出來。由於Web使用挖掘在大多數情況下屬於無偏向學習，有可能挖掘出所有的模式和規則，所以不能排除其中有些模式是常識性的，普通的或最終用戶不感興趣的，故必須採用模式分析的方法使得挖掘出來的規則和知識具有可讀性和最終可理解性。常見的模式分析方法有圖形和可視化技術、資料庫查詢機制、數理統計和可用性分析等。

電子商務中web數據挖掘的應用

與電子商務中web數據挖掘的應用相關的內容