skip to Main Content

یک رویکرد موثر بردار سازی به موازی سطح- گره های تو در تو برای پردازنده های گرافیکی CUDA

عنوان انگلیسی: An Efficient Vectorization Approach to Nested Thread-level Parallelism for CUDA GPUs
سال نشر: ۲۰۱۵
نویسنده: Shixiong Xu,David Gregg
تعداد صفحه فارسی: ۵ – تعداد صفحه انگلیسی: ۲
دانشگاه: Software Tools Group, The University of Dublin, Ireland
نشریه: Process Safety and Environmental Protection
کیفیت ترجمه: اقتصادی

چکیده

موازی سازی سطح مقطع (‏TLP)‏در کاربردهای {دنیای}واقعی فراگیر است. به عنوان مثال، ۷۵ % (‏۱۴ از ۱۹)‏کاربرد در معیار Rodinia {یک مجموعه معیار برای محاسبات ناهمگن. … برای کمک به معماران مطالعه سیستم عاملهای نوظهور مانند پردازنده‌های گرافیکی (واحد پردازش گرافیک) ، Rodinia شامل برنامه ها و هسته هایی است که پردازنده های چند هسته ای و پردازنده‌های گرافیکی را هدف قرار می دهند} برای شتاب‌دهنده ناهمگن شامل هسته‌های با قابلیت موازی سازی سطح مقطع تودرتو می‌باشند. نگاشت به طور موازی توالی توپی با موضوعات پردازنده‌های گرافیکی در مجموعه C – to-CUDA (OpenACC در این مقاله) اهمیت بیشتری پیدا می کند. نگاشت این مساله دارای ۲ شاخه است: مدلهای اجرای مناسب و استراتژی های نگاشت برداری کارآمد از موازی سازی تو در تو.

Abstract

true
امتیاز شما:
(No Ratings Yet)
Back To Top