عنوان انگلیسی: An Efficient Vectorization Approach to Nested Thread-level Parallelism for CUDA GPUs
سال نشر: ۲۰۱۵
نویسنده: Shixiong Xu,David Gregg
تعداد صفحه فارسی: ۵ – تعداد صفحه انگلیسی: ۲
دانشگاه: Software Tools Group, The University of Dublin, Ireland
نشریه: Process Safety and Environmental Protection
کیفیت ترجمه: اقتصادی
چکیده
موازی سازی سطح مقطع (TLP)در کاربردهای {دنیای}واقعی فراگیر است. به عنوان مثال، ۷۵ % (۱۴ از ۱۹)کاربرد در معیار Rodinia {یک مجموعه معیار برای محاسبات ناهمگن. … برای کمک به معماران مطالعه سیستم عاملهای نوظهور مانند پردازندههای گرافیکی (واحد پردازش گرافیک) ، Rodinia شامل برنامه ها و هسته هایی است که پردازنده های چند هسته ای و پردازندههای گرافیکی را هدف قرار می دهند} برای شتابدهنده ناهمگن شامل هستههای با قابلیت موازی سازی سطح مقطع تودرتو میباشند. نگاشت به طور موازی توالی توپی با موضوعات پردازندههای گرافیکی در مجموعه C – to-CUDA (OpenACC در این مقاله) اهمیت بیشتری پیدا می کند. نگاشت این مساله دارای ۲ شاخه است: مدلهای اجرای مناسب و استراتژی های نگاشت برداری کارآمد از موازی سازی تو در تو.
Abstract
true
امتیاز شما: