چکیده
در این مقاله رویکرد جدیدی که از مشکلات بیش پرازش و پیچیدگی که در ساخت درخت تصمیم نادیده گرفته میشوند ارائه میشود. درخت های تصمیم, ابزارهایی کارآمد برای ساخت نمونه های طبقه بندی به خصوص در مهندسی صنعتی هستد. در مرحله ی ساخت این درخت ها دو مشکل عمده وجود دارد که عبارتند از: انتخاب صفات مناسب و اجزای پایگاه داده . در پژوهش پیش رو، ازانتخاب صفات و نمونه داده به منظور غلبه بر مشکلات ذکر شده استفاده شده است. جهت اثبات رویکرد پیشنهادی، چندین آزمایش روی ۱۰ مجموعه داده ی معیار انجام و نتایج آنها با رویکردهای کلاسیک مقایسه شده است. در پایان، کارکرد مؤثر رویکرد پیشنهادی را در ساخت قواعد غیر پیچیده ی تصمیم به منظور تشخیص نقص در ماشین آلات دوار را ارائه خواهیم داد.
Abstract
This paper presents a new approach that avoids the over-fitting and complexity problems suffered in the construction of decision trees. Decision trees are an efficient means of building classification models, especially in industrial engineering. In their construction phase, the two main problems are choosing suitable attributes and database components. In the present work, a combination of attribute selection and data sampling is used to overcome these problems. To validate the proposed approach, several experiments are performed on 10 benchmark datasets, and the results are compared with those from classical approaches. Finally, we present an efficient application of the proposed approach in the construction of non-complex decision rules for fault diagnosis problems in rotating machines.