:
twitter line
研究生: 吳祖寧
研究生(外文): Tsu-Ning Wu
論文名稱: 處理方向性資料的可能性C均值聚類法
論文名稱(外文): The possibilistic C-means clustering of processing directional data
指導教授: 楊敏生 楊敏生引用關係 呂岡玶
指導教授(外文): Miin-Shen Yang Kang-Ping Lu
學位類別: 碩士
校院名稱: 中原大學
系所名稱: 應用數學研究所
學門: 數學及統計學門
學類: 數學學類
論文種類: 學術論文
論文出版年: 2019
畢業學年度: 107
語文別: 中文
論文頁數: 44
中文關鍵詞: 模糊C均值 可能性C均值 方向性資料 可能性C均值處理方向性資料
外文關鍵詞: fuzzy c-means possibilistic c-means directional data DD-PCM
相關次數:
  • 被引用 被引用:0
  • 點閱 點閱:115
  • 評分 評分:
  • 下載 下載:0
  • 收藏至我的研究室書目清單 書目收藏:0
在這個科技發達的時代,聚類分析已經是一種常見的數據分析工具,而現有的聚類分析演算法更是五花八門,常見的演算法如:硬式分割、模糊C均值等,能有效的處理一般資料,為了因應各種資料型態,也衍生出了許多的聚類演算法,所以在處理不同資料的時候,選擇相應的演算法是非常重要的。本文除了會介紹模糊C均值(FCM)和可能性C均值(PCM)之外,並且比較兩個演算法,而重點將會放在把可能性C均值拓展到方向性資料上,並稱之為方向性資料之可能性C均值(Directional Data-PCM),在保留可能性C均值優點的同時,讓其能夠有效的處理方向性資料。
在文章的最後會先用各種模擬資料的例子展示方向性資料之可能性C均值演算法的優點,除了能夠得到良好的聚類效果之外,還能夠找出各個資料的離群點。再將其運用在真實例子中,並從已知的分群結果與方向性資料之可能性C均值演算法得出的分群結果比較,就可以得知此演算法能做到有效的聚類結果。
In this era of technological advancement, cluster analysis is a commonly used tool for analyzing data. There have been lots of existing algorithms such as K-means and fuzzy c-means which can effectively handle data in general. Specifically, many clustering algorithms were designed for some kind of data. Thus, it is very important to choose a suitable algorithm for dealing with different materials. In this thesis, we propose a new algorithm called the possibilistic c-means of directional data, DD-PCM, for clustering directional data based on the PCM algorithm. We first review and compare two famous clustering algorithms, the fuzzy c-means and the possibilistic c-means algorithm. Then we focus on extending the use of the possibilistic c-means to the directional data. Directional data are represented by polar coordinates and then the possibilistic c-means is applied to angles for clustering data into proper classes. The new proposed algorithm does not only inherit the advantages of the possibilistic c-means algorithm but also handle directional data effectively.
We use the examples of various simulation data to demonstrate the advantage of the possibilistic C-means of directional data. Then we will use the examples of real data to test show the practicability of the possibilistic c-means of directional data algorithm. Experimental results actually show the effectiveness of the proposed algorithm in dealing directional data.
目錄
摘要 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ⅰ
Abstract. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ⅱ
誌謝 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ⅲ
目錄 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ⅳ
表目錄 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ⅴ
圖目錄 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ⅵ
第一章 緒論 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
第二章 模糊 C 均值(FCM)、可能性 C 均值(PCM)演算法.. 3
2-1 模糊 C 均值 (FCM) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3
2-2 可能性C均值(PCM) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2-3 FCM與 PCM 的比較. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
第三章 方向性資料之 PCM 演算法 . . . . . . . . . . . . . . . . . . . . . . . . . . 11
第四章 模擬與真實資料. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
4-1 模擬資料 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
4-2 真實資料 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
第五章 結論 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
參考文獻 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

表目錄
表(1). X 和 Y 為資料點座標,mu1、mu2 為屬於群心 1、2 的隸屬度 . . . . 10
表(2).模擬資料一的 MSE、AR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
表(3).模擬資料二的 MSE、AR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
表(4).模擬資料三的 MSE、AR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
表(5).模擬資料四的 MSE、AR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
表(6).40 筆關於風的方向資料. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
表(7).風資料的群心與AR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
表(8).風資料點隸屬所有群心的隸屬度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
表(9). 76 隻烏龜產完蛋後的方向資料 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
表(10).烏龜資料的群心與 AR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .31
表(11). 烏龜資料點隸屬所有群心的隸屬度 . . . . . . . . . . . . . . . . . . . . . . . . .32
表(12).三疊紀砂岩的群心與 AR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
表(13). 三疊紀砂岩資料點屬於所有群心的隸屬度 . . . . . . . . . . . . . . . .34

圖目錄
圖(1).橋梁點A(100,150)與離群點B(100,200)的模擬資料. . . . . . . . . . . . . 8
圖(2).模擬資料一分群狀況與群集中心 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
圖(3).模擬資料二分群狀況與群集中心 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
圖(4).模擬資料三分群狀況與群集中心 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
圖(5).模擬資料四分群狀況與群集中心 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
圖(6).風資料分群狀況與群集中心 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
圖(7).烏龜資料分群狀況與群集中心. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
圖(8).三疊紀砂岩資料分群狀況與群集中心. . . . . . . . . . . . . . . . . . . . . . . . . 34
[1] Bezdek, J.C. (1973), Fuzzy Mathematics in Pattern Classification, Ph.D. Thesis, Applied Math. Center, Cornell University, Ithaca, USA.
[2] Dunn, J.C. (1974), A fuzzy relative of the ISODATA process and its use in detecting compact, well-separated clusters, Journal of Cybernetics, 3, 32-57.
[3] Fisher, N.I., Lewis, T., Embleton, B.J.J. (1987), Statistical analysis of spherical data, Cambridge University.
[4] Krishnaouram, R. and Keller, J.M. (1993), A possibilistic approach to clustering, IEEE Trans. Fuzzy Systems, 1, 98-110.
[5] Krishnaouram, R. and Keller, J.M. (1996), The possibilistic c-means algorithm: Insights and recommendations, IEEE Trans. Fuzzy Systems, 4.
[6] Kesemen, O. (2015), Fuzzy c-means clustering algorithm for directional data (FCM4DD), Expert Systems With Applocations, 58, 76-82
[7] Mardia, K.V., Jupp, P.E. (1999), Directional Statistics, Academic Press Inc.
[8] Ruspini, E. (1969), A new approach to clustering, Information and Control, 15, 22-32.
[9] Stephens, M.A. (1969), Techniques for Directional Data. Technical Report 150, Dept. of Statistic, Stanford Univ.
[10] Zadeh, L.A. (1965), Fuzzy sets, Information and Control, 8, 338-353.
[11] 楊敏生, 楊鎮槐(2010), “模糊聚類及其應用”, 藍海文化.
電子全文 電子全文 ( 本篇電子全文限研究生所屬學校校內系統及IP範圍內開放 )