عنوان انگلیسی: A parallel metaheuristic data clustering framework for cloud
سال نشر: ۲۰۱۸
نویسنده: Chun-Wei Tsai,Shi-Jui Liu,Yi-Chung Wang
تعداد صفحه فارسی: ۱۸ – تعداد صفحه انگلیسی: ۱۴
دانشگاه: Taiwan Information Security Center at NCHU (TWISC@NCHU), Taichung, Taiwan, ROC,Department of Computer Science and Engineering, National Chung Hsing University, Taichung, Taiwan, ROC
نشریه: Process Safety and Environmental Protection
کیفیت ترجمه: اقتصادی
چکیده
تجزیه و تحلیل دادههای عملکرد بالا برای اینترنت اشیا (ءIoT)یک موضوع تحقیقاتی امیدبخش در سالهای اخیر بودهاست، زیرا الگوریتم های داده کاوی سنتی ممکن است برای دادههای بزرگ IoT کاربرد نداشته باشند. یکی از دلایل اصلی این است که دادههایی که باید مورد تجزیه و تحلیل قرار گیرند، ممکن است از اندازه ذخیرهسازی یک ماشین واحد فراتر رود. هزینه محاسباتی وظایف تجزیه و تحلیل دادهها که برای یک سیستم کامپیوتری بسیار بالا است، یک مشکل مهم دیگر است که باید در زمان تجزیه و تحلیل داده از یک سیستم IoT با آن روبرو شویم. به همین دلیل است که یک چارچوب خوشهبندی داده کارآمد برای الگوریتم فراابتکاری مبتنی بر محیط محاسبات ابری در این مقاله برای تجزیه و تحلیل داده ارایه شدهاست. که توضیح میدهد چگونه کارهای داده کاوی یک الگوریتم را به گرههای مختلف تقسیم کنیم (ءیعنی فرآیند نگاشت)و سپس نتایج استخراج از این گرهها را جمعبندی کنیم (ءیعنی کاهش روند). ما همچنین تلاش کردیم تا از چارچوب پیشنهادی برای پیادهسازی الگوریتمهای خوشهبندی دادهها (ءمثلا، k – means ،ژنتیک k – means، و بهینهسازی انبوه ذرات)بر روی یک سیستم
Abstract
A high performance data analytics for internet of things (IoT) has been a promising research subject in recent years because traditional data mining algorithms may not be applicable to big data of IoT. One of the main reasons is that the data that need to be analyzed may exceed the storage size of a single machine. The computation cost of data analysis tasks that is too high for a single computer system is another critical problem we have to confront when analyzing data from an IoT system. That is why an efficient data clustering framework for metaheuristic algorithm on a cloud computing environment is presented in this paper for data analytics, which explains how to divide mining tasks of a mining algorithm into different nodes (i.e., the Map process) and then aggregate the mining results from these nodes (i.e., Reduce process). We further attempted to use the proposed framework to implement data clustering algorithms (e.g., k -means, genetic k -means, and particle swarm optimizati
امتیاز شما: