新聞中心

EEPW首頁 > 模擬技術 > 設計應用 > 數據挖掘技術在交通事故分析中的應用

數據挖掘技術在交通事故分析中的應用

作者: 時間:2009-08-28 來源:網絡 收藏
1 引言
隨著國民經濟的快速發(fā)展和人民生活水平的不斷提高,在交通運輸業(yè)持續(xù)發(fā)展的同時,轎車大量進入普通百姓家庭.汽車的社會保有量快速增長,使得駕駛員培訓學校門庭若市,職業(yè)駕駛員、非職業(yè)駕駛員大量增加,汽車保險業(yè)快速發(fā)展,同時的絕對數量也不斷增加。對于誘發(fā)的原因,以及各種原因的概率分布就成為交通管理部門、商業(yè)保險企業(yè)、駕駛員培訓學校等機構普遍關心的問題。
借助計算機技術和信息處理技術的發(fā)展成果,各地交通管理部門不斷投入大量的人力物力,建設各種各樣的信息化管理系統(tǒng),如機動車輛信息管理系統(tǒng)、機動車駕駛員信息管理系統(tǒng)、信息管理系統(tǒng)等。伴隨著交通管理信息系統(tǒng)的不斷建設、完善與發(fā)展,積累了大量寶貴的數據資源,這些信息化系統(tǒng)和所積累的數據資源,對提高交通管理水平起了巨大作用。目前的交通信息管理系統(tǒng)主要任務是進行數據查詢或對特定的數據進行簡單獨立的數字處理,沒有對這些大量的數據所包含的內在有價值的信息有效提取。在如何利用這些海量數據資源進行交通事故發(fā)生原因及概率分布方面,做的工作還很少,使得這些寶貴的數據資源沒有發(fā)揮應有的作用。對這些進行歸類和有效處理,從中挖掘出表征交通事故發(fā)生的原因及分布概率的內在有用信息,為相關單位或機構提供某種程度或某種方面的決策依據,如交通事故防范、商業(yè)保險評估,機動車輛駕駛員培訓模式等等。從事物發(fā)展具有一定的內在聯(lián)系的觀點出發(fā),結合的研究成果,答案是肯定的。

2 的基本概念和方法
數據挖掘是指從大量的、不完全的、有噪聲的、模糊的、隨機的數據中識別出存在于數據庫中有效的、新穎的、具有潛在價值的、最終可理解的模式的非平凡知識的過程。它利用各種方法和分析工具在大規(guī)模的海量數據中建立模型和發(fā)現(xiàn)數據間的關系。數據挖掘的技術很多,相應的實現(xiàn)方法也很多。一般包括下述幾種方法:決策樹方法,神經網絡方法,概念樹方法,粗糙方法,遺傳算法,公式發(fā)現(xiàn),模糊論方法,統(tǒng)計學方法.可視化技術,貝葉斯網絡等。在不同的領域,針對需要解決的具體問題,需要完成的挖掘主題,采用不同的或方法。

本文引用地址:http://www.butianyuan.cn/article/188701.htm

3 交通管理信息數據挖掘方法
3.1 需求理解
涉及到交通管理信息積累的原始數據很多,存在于不同的數據庫中,甚至有些與交通安全相關的某些數據跨行業(yè)保存在其他行業(yè)的數據庫中,如氣象部門記錄的天氣氣象數據。這些數據庫大多是事務性的數據庫,其中的數據各自獨立、互不相關。數據挖掘的主題是從這些互不相關的數據中尋找出與交通事故相關的信息,導致交通事故發(fā)生的各種因素以及交通事故對各種因素的概率分布。
3.2 數據準備
由于機動車輛.機動車駕駛員、交通事故信息管理系統(tǒng)的建設都是針對特定需求建立起來的事務性數據庫,其中存放的數據往往不能直接用于挖掘主題的數據挖掘,必須進行必要的數據預處理或數據準備,包括數據選擇、凈化、轉換、數據縮減等工作,獲取與挖掘主題直接相關的有效數據。數據準備是非常重要的一個步驟,將影響數據挖掘的效率和準確度以及最終模式的有效性。
機動車駕駛員信息管理系統(tǒng)主要記錄與駕駛員相關的信息,如駕駛員姓名、性別、年齡、學歷、駕齡、準駕車輛類別、駕駛證編號、發(fā)證機關等;機動車輛信息管理系統(tǒng)記錄車主姓名、車輛牌號、型號、類別、顏色、發(fā)動機號、車架號、出廠時間、購買時間、車輛用途等;交通事故信息管理系統(tǒng)記錄肇事駕駛員信息,如肇事駕駛員姓名、性別、年齡、駕齡、駕駛證編號以及肇事車輛的牌照號、型號、類別等。這些信息有些與交通事故相關,有些信息無關。車輛事故發(fā)生的概率與駕駛人員本身有著密切的關系,影響駕駛人員安全駕駛的主要因素包括年齡、性別、駕齡等。數據處理后可得表l所示的與交通事故密切相關的數據記錄。

3.3 數據挖掘方法設計
數據挖掘算法或數據挖掘技術的選擇,依賴于已有的原始數據資源和選定的挖掘主題,本課題所涉及的數據資源儲存于不同的事務性數據庫中,而確定的挖掘主題是利用數據挖掘技術,對這些大量的數據進行宏觀的基礎研究,尋求導致各種交通事故發(fā)生諸多因素的概率分布,為交通管理部門、商業(yè)保險部門、安全教育部門、機動車駕駛員培訓部門等行業(yè)提供決策的宏觀支持。挖掘的方法選用分類模式中的決策樹方法,這是分類模式中常用的一種分類器,通過對大量數據進行有目的的分類,從中找到一些有價值的、潛在的信息。決策樹方法的主要優(yōu)點是可以生成可理解的規(guī)則,計算量小,可以處理連續(xù)和集合屬性,決策樹的輸出包括屬性重要性排序。決策樹是一個類似于流程圖的結構,它包括決策節(jié)點、分枝和葉子節(jié)點。根據本課題的目標,決策樹法采用ID3方法,選擇互信息最大的屬性作為根節(jié)點。表l中有3個決策屬性和一個分類屬性,決策屬性是駕駛員年齡、駕齡和性別,分類屬性是事故的有無。ID3算法包括信息熵的計算、屬性A條件熵的計算和互信息的計算。


上一頁 1 2 下一頁

評論


相關推薦

技術專區(qū)

關閉