![](/images/contact.png)
一、原始憑證真實性識別現(xiàn)狀
會計原始憑證的基本要求就是真實。在手工會計條件下,會計人員根據(jù)原始憑證編制記賬憑證,根據(jù)記賬憑證登記明細賬和總賬,期未根據(jù)賬簿編制會計報表。審計人員通過調(diào)閱紙面信息,加上自己的經(jīng)驗判斷,審計線索十分清楚。然而,在會計信息化工作方式下,紙面信息變成了磁性介質(zhì)上的代碼。在網(wǎng)絡經(jīng)營條件下,企業(yè)內(nèi)部業(yè)務的審計線索也發(fā)生了質(zhì)的變化。不僅記錄業(yè)務的內(nèi)部原始單據(jù),如領料單、入庫單、驗收單等原始憑證將變?yōu)殡姶呕男畔?,而且計算機信息系統(tǒng)根據(jù)確認的經(jīng)濟業(yè)務自動編制記賬憑證、登記賬薄、編制報表,實現(xiàn)財會核算自動化。這個轉變過程中潛伏的一大問題就是絕大多數(shù)的會計核算軟件并沒有解決對會計事項,即記賬憑證所根據(jù)的原始數(shù)據(jù)是否真實這一至關重要的問題。一旦憑證轉化成電子數(shù)據(jù)輸入計算機,后續(xù)所有工作都建立在這樣一個假設下。但當前的會計電算化并不能有效地防止做假賬和會計信息失真的問題。電算化會計賬表審計的前提是:必須保證電子數(shù)據(jù)的“原始性”,即電子數(shù)據(jù)是真實、可靠的,可以作為有效數(shù)據(jù)來進行審計。否則,信息化會計賬表審計就失去意義。在財務信息化過程中,原始憑證真實性問題會嚴重影響到財務報表質(zhì)量。因此,本文試圖將圖像檢索技術應用于識別虛假原始憑證,在財務處理軟件中增加新的應用解決原始憑證真實性識別問題,并給出構建該應用的技術難點與實現(xiàn)框架,以期達到提高審計質(zhì)量,將會計信息失真程度控制到最低。
二、圖像檢索技術識別虛假原始憑證的可行性分析
財務人員雖然在長期的實踐中積累了大量的識別憑證真?zhèn)蔚慕?jīng)驗,這些經(jīng)驗的積累需要較長時間的實踐,且難以精確、客觀描述,不利于在行業(yè)人員中開展培訓、推廣及使用,風險較高。而圖像檢索技術是近年來隨著多媒體信息爆炸式增長,為了滿足人們快速準確找到自己所需圖像的一種技術,也是當前計算機領域的研究熱點之一。它利用圖像的物理屬性,如顏色、形狀、紋理、區(qū)域等在圖像數(shù)據(jù)庫中尋找與目標圖像相關或者相似的圖像,稱為基于內(nèi)容的圖像檢索(Content-Based Image Retrieval CBIR),是目前圖像檢索的有效方法之一。原始憑證被掃描進電腦,以圖像格式存儲。根據(jù)審計人員經(jīng)驗,把偽造特征轉化成數(shù)字圖像特征描述,如文字色差、數(shù)字位置、對模糊重影、印章和票據(jù)用紙由于用稀釋劑泡過而明顯變淺的,字體大小或字形異樣的,復寫印跡背后深淺度異樣等特征,作為目標圖像。待識別票據(jù)或者憑證的特征可與之進行匹配,按照相似度做出真?zhèn)巫R別是完全可行的。加入該項應用后,在利用財務軟件進行審計時,使用人員可以直接調(diào)出某筆業(yè)務的原始憑證圖像,由系統(tǒng)進行識別,從而提高了工作效率。
三、圖像檢索技術識別虛假原始憑證的技術難點
雖然運用圖像檢索技術可有效識別虛假原始憑證,但其也存在技術難點,主要有:一是票面污損、破損、折疊、紙質(zhì)磨損等問題會直接影響掃描進計算機中的圖像質(zhì)量,給后續(xù)識別帶來難度,需要綜合運用圖像降噪、增強、恢復等技術,消除影響,提高識別率;二是票面不同區(qū)域的智能分割。識別真假票據(jù)的前提是提取其中的有效信息,如時間、科目、金額、印章等。這些信息存在于票面的不同區(qū)域,由于發(fā)票尺寸、形狀的不同,需要一種智能識別技術,能夠動態(tài)、自適應地分割不同區(qū)域,為進一步提取有效信息做準備;三是OCR與現(xiàn)有系統(tǒng)的融合。OCR已經(jīng)在實踐中獲得了廣泛的應用,為避免重復開發(fā),提高開發(fā)效率,可以直接將該技術應用于票據(jù)內(nèi)文字以及阿拉伯數(shù)字的識別,如何將其集成到現(xiàn)有系統(tǒng)中,構造合適的應用接口至關重要;四是如何結合審計人員實踐經(jīng)驗,利用圖像檢索技術提取相應票據(jù)特征,尤其是容易被涂改、造假的部位的細部特征,進行真假識別。
四、虛假原始憑證識別系統(tǒng)軟件框架的提出
考慮運用圖像檢索技術識別虛假原始憑證識別的技術難點,筆者擬提出虛假憑證識別系統(tǒng)軟件框架。軟件主要由兩部分組成:偽造憑證特征庫與憑證識別過程?;玖鞒倘缦拢菏紫?,采集大量虛假原始憑證樣本,掃描進電腦,以圖像形式存儲在圖像數(shù)據(jù)庫中,根據(jù)審計人員識別經(jīng)驗,將其中存在偽造的局部特征轉化成圖像特征描述。其次,使用各種距離度量算法與偽造特征庫特征進行距離比較,如歐氏距離計算二者差別大小,對明顯超出閾值范圍或者某一強制性指標有差異的憑證則認定為偽造,可以繼續(xù)結合人工審計確認。如果出現(xiàn)了新的偽造特征,還可以對偽造特征數(shù)據(jù)庫及時進行更新,以適應實際變化。這種原始憑證的處理方法充分利用審計人員長期積累的經(jīng)驗。同時,以電子手段保存原始憑證,有利于進一步開展審計工作,從客觀上杜絕各類虛假憑證犯罪。系統(tǒng)實現(xiàn)的關鍵技術是:利用直方圖均衡化技術與拉普拉斯濾波實現(xiàn)圖像增強,維納濾波技術對票據(jù)圖像進行降噪處理,經(jīng)過這些預處理手段后,掃描進計算機的票據(jù)圖像將更加干凈、整潔、規(guī)范,有利于進一步提取各種特征信息;利用Hough變換檢測票據(jù)中的垂直與水平線條,從而確定關鍵信息的空間分布區(qū)域;對獲取的目標區(qū)域進行OCR識別,獲得其中的文字、阿拉伯數(shù)字信息;根據(jù)審計人員識別虛假票據(jù)的經(jīng)驗,對獲取的目標區(qū)域提取顏色、紋理、線條等特征,從而識別字跡的模糊重影、線條粗細不均、書寫出格,字體大小或字形異樣以及票據(jù)背面復寫印跡深淺度等各種可能存在的問題。對一張票據(jù)建立起文字、數(shù)字、書寫特征三個角度的描述,為后續(xù)識別奠定基礎。