近年來,數據挖掘技術引起了信息產業(yè)界的極大關注,其主要原因是存在大量數據,可以廣泛使用,并且迫切需要將這些數據轉換成有用的知識和信息。根據美國GAO(General Accounting Office)的報告,聯邦政府利用數據挖掘技術在提高政府服務水平、分析科學數據、管理人力資源、偵察犯罪和恐怖活動等方面發(fā)揮了巨大的作用。尤其是在9·11以后,美國的反恐活動需要從大量的數據中搜尋有用的信息,數據挖掘技術功不可沒。除此以外,數據挖掘也被廣泛用于商業(yè)活動。根據Thomas G, John J和Il-woon Kim對財富500強企業(yè)的CFO的調查,在收到的有效反饋中,65%的企業(yè)正在使用數據挖掘技術。支持使用數據挖掘技術的企業(yè)稱數據挖掘技術的有效使用能夠為企業(yè)創(chuàng)造2000到2400萬的凈利潤。而在對數據挖掘使用領域的調查中發(fā)現:24%用在會計領域,42%用在金融領域,用在信息系統和市場領域分別占19%和5%。目前數據挖掘技術的應用多集中在金融保險、醫(yī)療保健、零售部門和電信部門。而對數據挖掘在提高企業(yè)內部經營管理、構筑企業(yè)競爭優(yōu)勢方面的應用鮮有提及。
一、數據挖掘技術的含義
數據挖掘是從數據當中發(fā)現趨勢和模式的過程,它融合了現代統計學、知識信息系統、機器學習、決策理論和數據庫管理等多學科的知識。它能有效地從大量的、不完全的、模糊的實際應用數據中,提取隱含在其中的潛在有用的信息和知識,揭示出大量數據中復雜的和隱藏的關系,為決策提供有用的參考。
二、數據挖掘的方法和基本步驟
?。ㄒ唬祿诰虻闹饕椒?
常用的數據挖掘方法主要有決策樹(Decision Tree)、遺傳算法(Genetic Algorithms)、關聯分析(Association Analysis)、聚類分析(Cluster Analysis)、序列模式分析(Sequential Pattern)以及神經網絡(Neural Networks)等。
?。ǘ祿诰虻幕静襟E
SAS研究所提出的SEMMA方法是目前最受歡迎的一種數據挖掘方法,其描述的數據挖掘的大致過程包括取樣(Sample)、探索(Explore)、修改(Modify)、模型(Model)和評價(Assess)。
1.數據取樣
在進行數據挖掘之前,首先要根據數據挖掘的目標選定相關的數據庫。通過創(chuàng)建一個或多個數據表進行抽樣。所抽取的樣本數據量既要大到足以包含有實際意義的信息,同時又不至于大到無法處理。
2.數據探索
數據探索就是對數據進行深入調查的過程,通過對數據進行深入探察以發(fā)現隱藏在數據中預期的或未被預期的關系和異常,從而獲取對事物的理解和概念。
3.數據調整
在上述兩個步驟的基礎上對數據進行增刪、修改,使之更明確、更有效。
4.建模
使用人工神經網絡、回歸分析、決策樹、時間序列分析等分析工具來建立模型,從數據中發(fā)現那些能夠對預測結果進行可靠預測的模型。
5.評價
就是對從數據挖掘過程中發(fā)現的信息的實用性和可靠性進行評估。
三、數據挖掘在管理會計中的運用
?。ㄒ唬祿诰蛟诠芾頃嬛羞\用的重要意義
1.提供有力的決策支持
面對日益激烈的競爭環(huán)境,企業(yè)管理者對決策信息的需求也越來越高。管理會計作為企業(yè)決策支持系統的重要組成部分,提供更多、更有效的有用信息責無旁貸。因此,從海量數據中挖掘和尋求知識和信息,為決策提供有力支持成為管理會計師使用數據挖掘的強大動力。例如,數據挖掘可以幫助企業(yè)加強成本管理,改進產品和服務質量,提高貨品銷量比率,設計更好的貨品運輸與分銷策略,減少商業(yè)成本。
2.贏得戰(zhàn)略競爭優(yōu)勢的有力武器
實踐證明數據挖掘不僅能明顯改善企業(yè)內部流程,而且能夠從戰(zhàn)略的高度對企業(yè)的競爭環(huán)境、市場、顧客和供應商進行分析,以獲得有價值的商業(yè)情報,保持和提高企業(yè)持續(xù)競爭優(yōu)勢。如,對顧客價值分析能夠將為企業(yè)創(chuàng)造80%價值的20%的顧客區(qū)分出來,對其提供更優(yōu)質的服務,以保持這部分顧客。
> 3.預防和控制財務風險
利用數據挖掘技術可以建立企業(yè)財務風險預警模型。企業(yè)財務風險的發(fā)生并非一蹴而就,而是一個積累的、漸進的過程,通過建立財務風險預警模型,可以隨時監(jiān)控企業(yè)財務狀況,防范財務危機的發(fā)生。另外,也可以利用數據挖掘技術,對企業(yè)籌資和投資過程中的行為進行監(jiān)控,防止惡意的商業(yè)欺詐行為,維護企業(yè)利益。尤其是在金融企業(yè),通過數據挖掘,可以解決銀行業(yè)面臨的如信用卡的惡意透支及可疑的信用卡交易等欺詐行為。根據SEC的報告,美國銀行、美國第一銀行、聯邦住房貸款抵押公司等數家銀行已采用了數據挖掘技術。 (二)數據挖掘在管理會計中的應用
1.作業(yè)成本和價值鏈分析
作業(yè)成本法以其對成本的精確計算和對資源的充分利用引起了人們的極大興趣,但其復雜的操作使得很多管理者望而卻步。利用數據挖掘中的回歸分析、分類分析等方法能幫助管理會計師確定成本動因,更加準確計算成本。同時,也可以通過分析作業(yè)與價值之間的關系,確定增值作業(yè)和非增值作業(yè),持續(xù)改進和優(yōu)化企業(yè)價值鏈。在Thomas G, John J和Il-woon Kim的調查中,數據挖掘被用在作業(yè)成本管理中僅占3%。
2.預測分析
管理會計師在很多情況下需要對未來進行預測,而預測是建立在大量的歷史數據和適當的模型基礎上的。數據挖掘自動在大型數據庫中尋找預測性信息,利用趨勢分析、時間序列分析等方法,建立對如銷售、成本、資金等的預測模型,科學準確的預測企業(yè)各項指標,作為決策的依據。例如對市場調查數據的分析可以幫助預測銷售;根據歷史資料建立銷售預測模型等。
3.投資決策分析
投資決策分析本身就是一個非常復雜的過程,往往要借助一些工具和模型。數據挖掘技術提供了有效的工具。從公司的財務報告、宏觀的經濟環(huán)境以及行業(yè)基本狀況等大量的數據資料中挖掘出與決策相關的實質性的信息,保證投資決策的正確性和有效性。如利用時間序列分析模型預測股票價格進行投資;用聯機分析處理技術分析公司的信用等級,以預防投資風險等。
4.顧客關系管理
顧客關系管理是提升企業(yè)競爭優(yōu)勢的有力武器。首先,要對顧客群體進行分類。通過對數據倉庫的分類和聚類分析,可發(fā)現群體顧客的行為規(guī)律,從而對顧客進行分組,實行差別化服務;其次,對顧客的價值進行分析,根據帕累托定律,20%的客戶創(chuàng)造了企業(yè)80%的價值。針對這種情況,公司可以從客戶數據庫中挖掘出這部分顧客,對這部分顧客的行為、需求以及偏好進行動態(tài)跟蹤和監(jiān)控,并根據不同的顧客群的不同特點提供相應的產品和服務,從而與顧客建立長期的合作關系,提高顧客保持力。如在電信部門,對電信數據進行多維分析有助于識別和比較不同顧客對于產品的不同需求,從而使企業(yè)提供更有特色的產品,為顧客提供更優(yōu)質的服務。
5.產品和市場分析
品種優(yōu)化是選擇適當的產品組合以實現最大的利益的過程,這些利益可以是短期利潤,也可以是長期市場占有率,還可以是構建長期客戶群及其綜合體。為了達到這些目標,管理會計師不僅僅需要價格和成本數據,有時還需要知道替代品的情況,以及在某一市場段位上它們與原產品競爭的狀況。另外企業(yè)也需要了解一個產品是如何刺激另一些產品的銷量的等等。例如,非盈利性產品本身是沒有利潤可言的,但是,如果它帶來了可觀的客戶流量,并刺激了高利潤產品的銷售,那么,這種產品就非常有利可圖,就應該包括在產品清單中。這些信息可根據實際數據,通過關聯分析等技術來得到。
6.財務風險分析
管理會計師可以利用數據挖掘工具來評價企業(yè)的財務風險,建立企業(yè)財務危機預警模型,進行破產預測。破產預測或稱財務危機預警模型能夠幫助管理者及時了解企業(yè)的財務風險,提前采取風險防范措施,避免破產。另外,破產預測模型還能幫助分析破產原因,對企業(yè)管理者意義重大。在20世紀30年代,Smith和Winakor率先進行了破產預測的嘗試。隨后到了20世紀60年代,Altman利用多維判別式分析(Multivariate Discriminant Analysis)方法提出的Z-score破產預測模型取得了很大的成功,預測準確率高達90%以上。此后,數據挖掘技術包括多維判別式分析(Multivariate Discriminant Analysis)、邏輯回歸分析(Logistic Regression Analysis)、遺傳算法、神經網絡以及決策樹等方法在企業(yè)破產預測中得到了廣泛的應用。
四、結束語
隨著我國加入WTO,企業(yè)面臨的競爭壓力也越來越大。充分利用信息技術的最新成果,挖掘企業(yè)自身潛力,加強企業(yè)內部管理,提升企業(yè)競爭力刻不容緩。數據挖掘技術的推廣應用雖然受到成本和技術的限制,但是如果能取得企業(yè)高層管理者的支持,數據挖掘的應用將會有很大的發(fā)展前景。