عنوان انگلیسی: Taiga: performance optimization of the C4.5 decisi
سال نشر: ۲۰۱۶
نویسنده: Yi Yang,Wenguang Chen
تعداد صفحه فارسی: ۱۲ – تعداد صفحه انگلیسی: ۱۱
دانشگاه: epartment of Computer Science and Technology, Tsinghua University, Beijing 100084, China, Department of Computer Science and Technology, Tsinghua University, Beijing 100084, China and Technology Innovation Center at Yinzhou, Yangtze Delta Region Institute of Tsinghua University, Yinzhou 315100, China
نشریه: Process Safety and Environmental Protection
کیفیت ترجمه: اقتصادی
چکیده
طبقه بندی یک مشکل مهم یادگیری ماشین است و الگوریتم های ساخت درخت تصمیم یک کلاس مهم برای حل این مشکل هستند. RainForest روش قابل قبولی برای پیادهسازی الگوریتم های ساخت درخت تصمیمگیری است.این الگوریتم شامل چندین الگوریتم است، که بهترین آنها ترکیبی بین یک پیادهسازی بازگشتی سنتی و یک پیادهسازی تکراری است که از حافظه بیشتر استفاده میکند اما عملیات نوشتن کمتر را شامل میشود.ما یک الگوریتم بهینهسازی الهامگرفته شده از rainforest را پیشنهاد میکنیم.با استفاده از یک معیار سوئیچینگ پیچیدهتر بین دو الگوریتم، میتوانیم حتی زمانی که همه اطلاعات آماری در حافظه جای میگیرند، بدست آوریم.ارزیابیها نشان میدهد که روش ما میتواند به طور میانگین ۲.۸ برابر نسبت به اجرای بازگشتی سنتی دست یابد.
Abstract
Classification is an important machine learning problem, and decision tree construction algorithms are an important class of solutions to this problem. RainForest is a scalable way to implement decision tree construction algorithms. It consists of several algorithms, of which the best one is a hybrid between a traditional recursive implementation and an iterative implementation which uses more memory but involves less write operations. We propose an optimized algorithm inspired by RainForest. By using a more sophisticated switching criterion between the two algorithms, we are able to get a performance gain even when all statistical information fits in memory. Evaluations show that our method can achieve a performance boost of 2.8 times in average than the traditional recursive implementation.
امتیاز شما: