عنوان انگلیسی: A clustering ensemble: Two-level-refined co-association matrix with path-based transformation
سال نشر: ۲۰۱۵
نویسنده: Caiming Zhong,Xiaodong Yue,Zehua Zhang,Jingsheng Lei
تعداد صفحه فارسی: ۹ – تعداد صفحه انگلیسی: ۱۱
دانشگاه: Department of Computer Science and Technology, Shanghai University, 200444 Shanghai, China,College of Science and Technology, Ningbo University, 315211 Ningbo, China,College of Computer Science and Technology, Taiyuan University of Technology, 030024 Taiyuan, China,School of Computer Science and Technology, Shanghai University of Electric Power, 200090 Shanghai, China
نشریه: Process Safety and Environmental Protection
کیفیت ترجمه: اقتصادی
چکیده
هدف از هنگرد خوشهبندی این است که پارتیشنهای پایه چندگانه را با یک پارتیشن قوی، ثابت و دقیق ترکیب کنید. یکی از مشکلات کلیدی هنگرد خوشهبندی این است که چگونه اطلاعات ساختار خوشهای را در هر پارتیشن پایه بهرهبرداری کند. تجمع شواهدی یک چارچوب موثر است که میتواند پارتیشنهای پایه را به یک ماتریس همکاری تبدیل کند. این ماتریس بسامد یک جفت نقطه را که به یک خوشه تقسیم میشوند را توصیف میکند، اما برخی از اطلاعات پنهان در پارتیشن های پایه را نادیده میگیرد. در این مقاله، ما برخی از آن اطلاعات را با پالایش ماتریکس همکاری از نقطه داده و سطح خوشه پایه نشان میدهیم. از سطح نقطه داده، به عنوان جفتهای نقاط در یک خوشه پایه، ممکن است شباهتهای مختلفی نیز داشته باشد، سهم آنها در ماتریس همکاری میتواند متفاوت باشد. از سطح خوشه، چون خوشههای پایه ممکن است ویژگیهای متنوع داشته باشند، سهم یک خوشه پایه به عنوان یک کل میتواند با بقیه نیز متفاوت باشد. پس از پالایش، ماتریس همکاری به ماتریس تشابه مبتنی بر مسیر تبدیل میشود به طوری که اطلاعات سراسری بیشتری از ساختار خوشهای در ماتریس گنجانده میشود. در ن
Abstract
The aim of clustering ensemble is to combine multiple base partitions into a robust, stable and accurate partition. One of the key problems of clustering ensemble is how to exploit the cluster structure information in each base partition. Evidence accumulation is an effective framework which can convert the base partitions into a co-association matrix. This matrix describes the frequency of a pair of points partitioned into the same cluster, but ignores some hidden information in the base partitions. In this paper, we reveal some of those information by refining the co-association matrix from data point and base cluster level. From the data point level, as pairs of points in the same base cluster may have varied similarities, their contributions to the co-association matrix can be different. From the cluster level, since the base clusters may have diversified qualities, the contribution of a base cluster as a whole can also be different from those of others. After being refined, the c
امتیاز شما: