skip to Main Content

یک الگوریتم کارآمد و موثر برای استخراج K الگوی برتر متناوب

عنوان انگلیسی: An efficient and effective algorithm for mining top-rank-k frequent patterns
سال نشر: ۲۰۱۵
نویسنده: Quyen Huynh-Thi-Le,Tuong Le,Bay Vo,Bac Le
تعداد صفحه فارسی: ۲۷ – تعداد صفحه انگلیسی: ۹
دانشگاه: Department of Computer Science, University of Science, VNU-HCM, Viet Nam b Division of Data Science, Ton Duc Thang University, Ho Chi Minh, Viet Nam c Faculty of Information Technology, Ton Duc Thang University, Ho Chi Minh, Viet Nam
نشریه: Process Safety and Environmental Protection
کیفیت ترجمه: ترجمه پلاس

چکیده

استخراج الگوهای متناوب کاندیدهای بسیاری تولید میکند که نیاز به صرف مقدار زیادی از حافظه و زمان استخراج دارد. در کاربردهای واقعی، از تعداد کمی از الگوهای متناوب استفاده می شود. بنابراین، استخراج K الگوی برتر متناوب که تعداد الگوهای متناوب استخراج شده را با رتبه بندی آنها برحسب تناوب محدود میکند، مورد توجه قرار گرفته است. این مقاله الگوریتم iNTK را پیشنهاد می کند که یک نسخه بهبود یافته از الگوریتم NTK برای استخراج K الگوی برتر متناوب است. این الگوریتم از یک ساختار N-لیست برای نشان دادن الگوها استفاده میکند. این مفهوم استنتاجی برای سرعت بخشیدن به روند استخراج K الگوی برتر مورد استفاده قرار میگیرد. آزمایش هایی برای ارزیابی iNTK و NTK برحسب زمان استخراج و مصرف حافظه برای هشت مجموعه داده انجام گرفته است. نتایج تجربی نشان می دهد که iNTK کارآمد تر و سریعتر از NTK است.

Abstract

Frequent pattern mining generates a lot of candidates, which requires a lot of memory usage and mining time. In real applications, a small number of frequent patterns are used. Therefore, the mining of top-rank-k frequent patterns, which limits the number of mined frequent patterns by ranking them in frequency, has received increasing interest. This paper proposes the iNTK algorithm, which is an improved version of the NTK algorithm, for mining top-rank-k frequent patterns. This algorithm employs an N-list structure to represent patterns. The subsume concept is used to speed up the process of mining top-rank-k patterns. The experiments are conducted to evaluate iNTK and NTK in terms of mining time and memory usage for eight datasets. The experimental results show that iNTK is more efficient and faster than NTK.
امتیاز شما:
(No Ratings Yet)
Back To Top