عنوان انگلیسی: Feature selection considering the composition of feature relevancy
سال نشر: ۲۰۱۸
نویسنده: Wanfu Gao,Liang Hu,Ping Zhang,Jialong He
تعداد صفحه فارسی: ۱۱ – تعداد صفحه انگلیسی: ۸
دانشگاه: College of Software, Jilin University, Changchun 130012, China,School of Mechanical Science and Engineering, Jilin University, Changchun 130012, China,College of Computer Science and Technology, Jilin University, Changchun 130012, China
نشریه: Process Safety and Environmental Protection
کیفیت ترجمه: ترجمه پلاس
چکیده
انتخاب ویژگی نقش مهمی در طبقهبندی مشکلات و مسائل دارد. روشهای انتخاب ویژگی قصد دارند ویژگیهای مرتبط را حفظ کرده و ویژگیهای اضافی را حذف کنند. این کار بر روشهای انتخاب ویژگی مبتنی بر تئوری اطلاعات تمرکز دارد. با بررسی ترکیب ربط ویژگی ها، ما معتقدیم که یک روش انتخاب ویژگی خوب باید اطلاعات طبقهبندی جدید را به حداکثر برساند در حالی که افزونگی ویژگی را به حداقل میرساند. بنابراین، یک روش انتخاب ویژگی جدید به نام ترکیب پذیری مشخصه (CFR)پیشنهاد شدهاست. برای ارزیابی CFR، ما آزمایشهایی را بر روی هشت مجموعه داده حقیقی و دو دسته طبقهبندی کننده مختلف انجام میدهیم (Naive – Bayes و ماشین بردار پشتیبان). روش ما نسبت به پنج روش رقیب دیگر از نظر دقت طبقهبندی و بالاترین صحت طبقهبندی بهتر عمل میکند.
Abstract
Feature selection plays a critical role in classification problems. Feature selection methods intend to retain relevant features and eliminate redundant features. This work focuses on feature selection methods based on information theory. By analyzing the composition of feature relevancy, we believe that a good feature selection method should maximize new classification information while minimizing feature redundancy. Therefore, a novel feature selection method named Composition of Feature Relevancy (CFR) is proposed. To evaluate CFR, we conduct experiments on eight real-world data sets and two different classifiers (Naïve-Bayes and Support Vector Machine). Our method outperforms five other competing methods in terms of average classification accuracy and highest classification accuracy.
امتیاز شما: