新岳乱合集目录500伦_在教室里被强h_幸福的一家1—6小说_美女mm131爽爽爽作爱

免費(fèi)咨詢電話:400 180 8892

您的購(gòu)物車(chē)還沒(méi)有商品,再去逛逛吧~

提示

已將 1 件商品添加到購(gòu)物車(chē)

去購(gòu)物車(chē)結(jié)算>>  繼續(xù)購(gòu)物

您現(xiàn)在的位置是: 首頁(yè) > 免費(fèi)論文 > 會(huì)計(jì)論文 > 基于粗糙集的市場(chǎng)潛在客戶預(yù)測(cè)模型

基于粗糙集的市場(chǎng)潛在客戶預(yù)測(cè)模型

��一、問(wèn)題提出
  隨著市場(chǎng)競(jìng)爭(zhēng)加劇大,如何用歷史交易數(shù)據(jù)預(yù)測(cè)市場(chǎng)潛在客戶,成為研究熱點(diǎn)。粗糙集是用已有知識(shí)刻畫(huà)不確定或不精確的知識(shí),確定給定問(wèn)題的近似域。運(yùn)用粗糙集預(yù)測(cè)潛在客戶可提高發(fā)現(xiàn)效率。
   ��二、粗糙集相關(guān)概念
  (一) 近似集
  設(shè)�X∈U�,�U�上的一個(gè)等價(jià)關(guān)系用�R�表示。當(dāng)集合�X�能表示成某些�R�基本知識(shí)的并集時(shí),稱集合�X�為�R�的精確集;否則,集合�X�只能以逼近的方式刻畫(huà),稱集合�X�是�R�粗糙集或不可定義集。
  �包含X的最小R精確集稱為X 的R上近似,記為R(X);X所包含的最大R精確集稱為X 的R下近似,記為�R�-(X)。即:R(X)={a∈U|[a]�R∩X≠φ}
 ??;R-(X)={a∈U|[a]�R}�X
 ??;稱BN�R(X)=R(X)-R-(X)
  為X的R邊界區(qū)域。�
  (二)信息系統(tǒng)與決策表
  設(shè)四元組�S=(U,A,V,F)�,其中�S�為知識(shí)表達(dá)系統(tǒng),�U={X�1,X�2,…X�n}�是對(duì)象的非空有限集合,為論域:�A={a�1,a�2,…,a�m}�是屬性的非空有限集合;�V=U�a∈A�V�n�是屬性值域;�f∶V×A�V�為信息函數(shù),�a∈A,x∈U,f(x,a)∈V�a。�
  �具有條件屬性C和決策屬性D,A=C∩D,C∩D=φ�的信息系統(tǒng)稱為決策表。
 ?。ㄈ?屬性的依賴性與重要度
  在�S=(U,A,V,f)�
  中屬性�D對(duì)屬性C�的依賴度為:�γ�c(D)=|POS�c(D)||U|�
  
  �其中POS�c(D)表示D在U/IND(C)上的正區(qū)域。γ�c(D)給出屬性C用分類(lèi)特性對(duì)分類(lèi)U/D的全部信息。�
  �在決策系統(tǒng)S=(U,A,V,f)中,a∈C的屬性重要度為:�
  �SGF��(C,D)�(a)=γ�C(D)-γ��C-{a}�(D)γ�C(D)�
  
  �其中SGF��(C,D)�(a)∈[0,1],若SGF�(C,D)(a)=0,則屬性a對(duì)于D可省略;若SGF��(C,D)�(a)≠0,則屬性a對(duì)于D不可缺少。SGF��(C,D)�(a)
  值越大,屬性a對(duì)于D就越重要。�
   ��三、預(yù)測(cè)模型的設(shè)計(jì)
  基于粗糙集預(yù)測(cè)潛在客戶步驟:
  1)明確系統(tǒng)目標(biāo),建立相關(guān)數(shù)據(jù)集;
  2)數(shù)據(jù)預(yù)處理:對(duì)數(shù)據(jù)包含的空值進(jìn)行處理,如填入、刪除或連續(xù)屬性離散化;
  3)計(jì)算條件屬性集的約簡(jiǎn);
  4)產(chǎn)生分類(lèi)規(guī)則,選擇和過(guò)濾規(guī)則。
 ?。ㄒ唬?shù)據(jù)預(yù)處理
  1.決策表補(bǔ)齊
  對(duì)不完備的信息表補(bǔ)齊遺漏數(shù)據(jù)的方法:
  1)刪除缺損數(shù)據(jù),得到完備的數(shù)據(jù)表,此方法局限于信息表數(shù)據(jù)量極大而缺損數(shù)據(jù)量相對(duì)很小時(shí);
  2)將缺損數(shù)據(jù)作為特殊屬性值處理;
  3)通過(guò)統(tǒng)計(jì)方法,根據(jù)決策表中各屬性值取值的記錄情況估計(jì)缺損數(shù)據(jù);
  4)運(yùn)用粗糙集建立數(shù)據(jù)間的不可分辨關(guān)系,補(bǔ)齊缺損數(shù)據(jù)。
  2.不完備數(shù)據(jù)分析方法
  空缺數(shù)據(jù)值的填補(bǔ)要使完整化后的信息系統(tǒng)產(chǎn)生的分類(lèi)規(guī)則具有盡可能高的支持度,盡量集中產(chǎn)生的規(guī)則,使信息系統(tǒng)的其他相似對(duì)象與具有遺漏值的對(duì)象的屬性值之間高度一致,使屬性值之間差異較小。
  3.連續(xù)屬性值的離散化
  運(yùn)用粗糙集處理決策表時(shí)要求用離散數(shù)據(jù)表達(dá)屬性值。把連續(xù)屬性的取值區(qū)間劃分成若干小區(qū)間稱為離散化,每個(gè)小區(qū)間有相應(yīng)離散符號(hào)??筛鶕?jù)某種規(guī)則由系統(tǒng)自動(dòng)劃分或由領(lǐng)域?qū)<腋鶕?jù)經(jīng)驗(yàn)劃分。
  離散化后決策表要盡量保持較少的空間維數(shù),即剩余屬性值的個(gè)數(shù);且離散化后決策表不能改變?cè)袥Q策表的不可辨識(shí)關(guān)系,即盡量減少信息丟失。
 ?。ǘ?shù)據(jù)約簡(jiǎn)
  1.屬性約簡(jiǎn)
  在知識(shí)庫(kù)的分類(lèi)或決策能力不變條件下,刪除其中冗余知識(shí)稱為屬性約簡(jiǎn),約簡(jiǎn)后的屬性被應(yīng)于導(dǎo)出分類(lèi)規(guī)則。約簡(jiǎn)后屬性個(gè)數(shù)越少,表明相對(duì)應(yīng)的分類(lèi)規(guī)則所需考慮的因素越少。屬性值組合數(shù)目最小的約簡(jiǎn)為最優(yōu)屬性約簡(jiǎn)。
  2.一般的屬性約簡(jiǎn)算法
  1)設(shè)決策表的條件屬性集為C,決策屬性集為D。對(duì)于每個(gè)條件屬性a�i∈C,計(jì)算該屬性重要度r�c(D)-r��c-a�(D)。
  2)若r�c(D)-r��c-a�i�(D)=0,則該屬性a�i相對(duì)于決策分類(lèi)是冗余的,可刪除。
  3)反之屬性a�i相對(duì)于決策分類(lèi)是必要的,不可刪除。
  4)屬性集合不再變化時(shí),輸出結(jié)果。
 ?。ㄈ?分類(lèi)規(guī)則約簡(jiǎn)
  1.分類(lèi)規(guī)則表現(xiàn)形式
  在決策表�S=(U,A,V,f)�中,定義形如C�D的邏輯含義為分類(lèi)規(guī)則。C表示規(guī)則的前提,D表示規(guī)則的結(jié)論。規(guī)則約簡(jiǎn)是對(duì)每一條分類(lèi)規(guī)則進(jìn)行約簡(jiǎn),刪除決策規(guī)則的冗余屬性值,使決策規(guī)則最小化。
  2.分類(lèi)規(guī)則的度量參數(shù)
  粗糙集分析的目的是將規(guī)則應(yīng)用于實(shí)際,規(guī)則包括如下測(cè)量值:
  1)支持量和支持度
  支持度定義:sup port(C�D)=|C∩D||U|
  其中,支持量定義為|C∩D|
  ,U為總體,|U|表示總體的數(shù)量,支持度用于描述所得規(guī)則在數(shù)據(jù)集中的統(tǒng)計(jì)重要性,
  sup port(C�D)越大,說(shuō)明由C得到D的機(jī)會(huì)越大,規(guī)則的價(jià)值越大。
  2)可信度
  規(guī)則的可信度:confidence(C�D)=sup port(C∩D)sup port(C)=|C∩D||C|
  sup port(C�D)測(cè)度了根據(jù)C能得出結(jié)論D的可信度,并且是條件概率p(D|C)的頻率估計(jì)。
  3)覆蓋率
  規(guī)則的覆蓋率越大,其適用性越強(qiáng),決策值的分布對(duì)規(guī)則的適用性也有影響。規(guī)則的適用度為:
  cecoverage(C�D)=sup port(C∩D)sup port(C)=|C∩D||D|
  。
  3.改進(jìn)的一般分類(lèi)規(guī)則約簡(jiǎn)算法
  針對(duì)目前的數(shù)據(jù)存儲(chǔ)系統(tǒng)中經(jīng)常存在不一致信息現(xiàn)象,修正一般的屬性約簡(jiǎn)方法,約簡(jiǎn)不一致系統(tǒng)的分類(lèi)規(guī)則。算法步驟:
  1)將原始決策表中的沖突記錄標(biāo)記出,從規(guī)則集合里面取任一規(guī)則。
  2)若該規(guī)則為一致規(guī)則,對(duì)于�γ∈C,如果去掉該條件屬性,該規(guī)則沒(méi)有和其他規(guī)則沖突,即x��C/{r}��[x]�D,說(shuō)明該條件屬性可以從此規(guī)則中刪除掉。若規(guī)則沒(méi)有全部抽取完畢,則轉(zhuǎn)到第1步;若每一條記錄結(jié)束,則轉(zhuǎn)到第4步。
  3)若該規(guī)則為不一致規(guī)則,重新定義[x]�D,[x]�D必須包含原始決策表中相關(guān)的沖突記錄,然后轉(zhuǎn)到第2步;
  4)算法結(jié)束。
   ��四、 結(jié)論
  粗糙集理論作為數(shù)據(jù)挖掘的一種方法,能有效處理不完整、不一致及不確定性的信息。通過(guò)基于粗糙集理論預(yù)測(cè)模型,為企業(yè)提供預(yù)測(cè)潛在客戶的價(jià)值水平,更有針對(duì)性地制定客戶發(fā)展戰(zhàn)略。
  

服務(wù)熱線

400 180 8892

微信客服