skip to Main Content

افراز نمونه تصادفی: یک مدل داده توزیع شده برای تحلیل داده‌های بزرگ

عنوان انگلیسی: Big Data-Based Improved Data Acquisition and Storage System for Designing Industrial Data Platform
سال نشر: ۲۰۱۹
نویسنده: Daoqu Geng,Chengyun Zhang,Chengjing Xia,Xue Xia,Qilin Liu,Xinshuai Fu
تعداد صفحه فارسی: ۱۶ – تعداد صفحه انگلیسی: ۹
دانشگاه: College of automation, Chongqing University of Posts and Telecommunications, Chongqing, China
نشریه: Process Safety and Environmental Protection
کیفیت ترجمه: ترجمه پلاس

چکیده

با افزایش حجم داده‌ها، استراتژی‌های جایگزین برای تقسیم داده‌های بزرگ به بلوک‌های اطلاعات سازگار آماری مورد نیاز هستند که می‌توانند مستقیما به عنوان نمونه‌های نماینده کل مجموعه داده در تحلیل داده‌های بزرگ مورد استفاده قرار گیرند. در این مقاله، ما مدل داده توزیعی تصادفی (‏RSP)‏را برای نشان دادن یک مجموعه داده بزرگ به عنوان مجموعه‌ای از بلوک‌های داده گسسته، که RSP نامیده می شود، پیشنهاد می‌کنیم. هر بلوک RSP یک توزیع احتمال مشابه با کل مجموعه داده دارد. از بلوک‌های RSP می توان برای تخمین ویژگی‌های آماری داده‌ها و ساخت مدل‌های پیش‌بینی بدون محاسبه کل مجموعه داده‌ها استفاده کرد. ما مفاهیم مدل RSP را در نمونه‌برداری از داده‌های بزرگ نشان می‌دهیم و یک روش جدید برای تحلیل داده‌های بزرگ معرفی می‌کنیم که می‌تواند برای سناریوهای مختلف در صنعت اعمال شود. این روش به طور قابل‌توجهی بار محاسباتی داده‌های بزرگ را کاهش داده و بهره‌وری دانشمندان داده را افزایش می‌دهد.

Abstract

true
امتیاز شما:
(No Ratings Yet)
Back To Top