日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

模糊關聯規則挖掘

系統 2293 0

?模糊關聯規則挖掘

? 關聯規則挖掘是數據挖掘最基本和最常用的算法之一,Apriori算法基本上是每個學習數據挖掘的同學掌握的第一個算法。但是,一般的關聯規則挖掘算法無法處理涉及連續值的記錄。? 雖然某些算法把連續值通過劃分區間的方法離散化,但是這種硬邊界劃分的方法效果并不是很好,一些在邊緣附近的數據只能屬于一個劃分,而這與事實不符。比如,年齡的一個劃分可以是青年,但如果我們把青年的區間定義為[20,30],則19歲的人就被排除在青年的范圍之外了,顯然這不是很合適。針對這種問題,我們可以基于模糊集把區間劃分成多個模糊集,然后求得某個元素屬于某個模糊集的概率(根據模糊隸屬函數),這樣的話每個元素都可以屬于多個不同的模糊集,而不是只屬于一個集合。劃分模糊集的常用算法是FCM,見參考文獻。

? 當我們給定了所有連續值屬性的模糊集劃分之后,下一步就是進行關聯規則的挖掘了,我們定義問題如下:

? T={t 1 ,t 2 ,...,t n }是數據集

? I={i 1 ,i 2 ,...,i m }是屬性集,我們假定所有的屬性都是數值型。

? F ik ={f ik 1 ,f ik 2 ,...,f ik l }代表第ik個屬性的模糊集。

? 我們要挖掘的模糊關聯規則的形式為:

? ?If X is A then Y is B.

? 其中,X和Y是屬性,A和B是X,Y對應的模糊集中的某個劃分,比如:

? X為年齡,其對應的模糊集為{嬰兒,幼兒,少年,青年,壯年,老年},A為青年,Y為薪水,其對應的模糊集為{低薪,中薪,高薪},B為高薪。

? 模糊關聯規則挖掘的過程為:

? 1. 計算significance factor

? 對于每個屬性X與X屬性對應的模糊集的劃分的屬性-劃分對<X,A>,比如<年齡,青年>,計算其significance系數:

? 模糊關聯規則挖掘_第1張圖片

? 其中

? m aj 是用FCM算法已經算好的模糊隸屬函數的值,只有當其大于閥值w時,我們才會取其值,否則只取0.

? ?2. 計算certainty factor

? 對于第一步求得的所有的significance系數大于給定值的<Z,C>對,我們計算所有屬性-劃分對:<X,A>,<Y,B>的certainty系數:

? 模糊關聯規則挖掘_第2張圖片

? 求得的certainty系數大于給定值的<X,A>,<Y,B>就是我們要挖掘的關聯規則:

? If X is A then Y is B.?

?

? ? 參考文獻:

? ? [1] Chan Man Kuok, Ada Fu, Man Hon Wong. Mining Fuzzy Association Rules in Databases.

? ? [2] FCM聚類算法簡介

模糊關聯規則挖掘


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 定襄县| 丹寨县| 阳朔县| 隆尧县| 磐安县| 黑龙江省| 滨州市| 定陶县| 宜君县| 安乡县| 临猗县| 方山县| 定西市| 浦城县| 甘泉县| 蒙城县| 郑州市| 雅江县| 丰原市| 进贤县| 紫金县| 汝南县| 贵定县| 楚雄市| 南岸区| 青龙| 福州市| 吉安县| 磐安县| 安吉县| 大宁县| 印江| 井研县| 巴青县| 夏邑县| 安达市| 寿阳县| 定安县| 霍州市| 西林县| 榆社县|