skip to Main Content

وزن دهی متغیر خودکار در خوشه‌بندی نوع k – Means

عنوان انگلیسی: Automated variable weighting in k-means type clustering
سال نشر: ۲۰۰۵
نویسنده: J.Z. Huang,M.K. Ng, Hongqiang Rong, Zichen Li
تعداد صفحه فارسی: ۳۰ – تعداد صفحه انگلیسی: ۱۲
دانشگاه: School of Computer Science & Information Technology, Beijing Jiaotong University, Beijing, China
نشریه: Process Safety and Environmental Protection
کیفیت ترجمه: ترجمه پلاس

چکیده

– این مقاله یک الگوریتم خوشه‌بندی نوع k – means پیشنهاد می‌کند که می‌تواند به طور خودکار وزن‌های متغیر را محاسبه کند. یک گام جدید به فرآیند خوشه‌بندی k – means برای به روز رسانی تکراری وزن‌های متغیر براساس تقسیم فعلی داده‌ها معرفی می‌شود و فرمولی برای محاسبه وزن پیشنهاد می‌شود. قضیه هم‌گرایی فرآیند خوشه‌بندی جدید ارایه شده‌است. وزن‌های متغیر تولید شده توسط الگوریتم، اهمیت متغیرها در خوشه‌بندی را اندازه‌گیری می‌کند و می‌تواند در انتخاب متغیر در کاربردهای داده کاوی استفاده شود که در آن داده‌های واقعی بزرگ و پیچیده اغلب درگیر هستند. نتایج تجربی بر روی داده‌های ساختگی و واقعی نشان داده‌است که الگوریتم جدید در بازیابی خوشه‌ها در داده‌ها از الگوریتم های استاندارد نوع k – means پیشی گرفته‌است.

Abstract

This paper proposes a k-means type clustering algorithm that can automatically calculate variable weights. A new step is introduced to the k-means clustering process to iteratively update variable weights based on the current partition of data and a formula for weight calculation is proposed. The convergency theorem of the new clustering process is given. The variable weights produced by the algorithm measure the importance of variables in clustering and can be used in variable selection in data mining applications where large and complex real data are often involved. Experimental results on both synthetic and real data have shown that the new algorithm outperformed the standard k-means type algorithms in recovering clusters in data.
امتیاز شما:
(No Ratings Yet)
Back To Top