skip to Main Content

یادگیری تقویت عمیق برای ناوبری پهپاد با استفاده از داده‌های حسگر

عنوان انگلیسی: Deep reinforcement learning for drone navigation using sensor data
سال نشر: ۲۰۲۰
نویسنده: Victoria J. Hodge,Richard Hawkins,Rob Alexander
تعداد صفحه فارسی: ۲۷ – تعداد صفحه انگلیسی: ۱۹
دانشگاه: Department of Computer Science, University of York, York, YO10 5GH, UK
نشریه: Process Safety and Environmental Protection
کیفیت ترجمه: ترجمه پلاس

چکیده

روبات‌های متحرک مانند وسایل نقلیه هوایی بدون سرنشین (هواپیماهای بدون سرنشین) ‏می‌توانند برای نظارت، نظارت و جمع‌آوری داده‌ها در ساختمان‌ها، زیرساخت‌ها و محیط مورد استفاده قرار گیرند. اهمیت نظارت دقیق و چند جانبه به خوبی شناخته شده‌است تا مشکلات را زود تشخیص داده و از افزایش آن‌ها جلوگیری شود. این امر نیاز به روبات‌های متحرک انعطاف‌پذیر، خودمختار و قدرتمند تصمیم‌گیری را تحریک می‌کند. این سیستم‌ها باید قادر به یادگیری از طریق استفاده از داده‌های منابع چندگانه باشند. تا همین اواخر، آن‌ها مخصوص کار بوده‌اند. در این مقاله، ما یک الگوریتم ناوبری عمومی را توصیف می‌کنیم که از داده‌های حسگرهای روی عرشه هواپیماهای بدون سرنشین برای هدایت هواپیماهای بدون سرنشین به محل مشکل استفاده می‌کند. در وضعیت‌های خطرناک و حساس به ایمنی، تعیین دقیق و سریع مشکلات حیاتی است. ما از الگوریتم بهینه‌سازی سیاست مجاور یادگیری تقویتی عمیق همراه با یادگیری برنامه‌درسی افزایشی و شبکه‌های عصبی حافظه کوتاه‌مدت بلند مدت برای اجرای الگوریتم جهت‌یابی عمومی و سازگار استفاده می‌کنیم. ما پیکربندی‌های مختلف را در برابر یک روش اکت

Abstract

Mobile robots such as unmanned aerial vehicles (drones) can be used for surveillance, monitoring and data collection in buildings, infrastructure and environments. The importance of accurate and multifaceted monitoring is well known to identify problems early and prevent them escalating. This motivates the need for flexible, autonomous and powerful decision-making mobile robots. These systems need to be able to learn through fusing data from multiple sources. Until very recently, they have been task specific. In this paper, we describe a generic navigation algorithm that uses data from sensors on-board the drone to guide the drone to the site of the problem. In hazardous and safety-critical situations, locating problems accurately and rapidly is vital. We use the proximal policy optimisation deep reinforcement learning algorithm coupled with incremental curriculum learning and long short-term memory neural networks to implement our generic and adaptable navigation algorithm. We evaluat
امتیاز شما:
(No Ratings Yet)
Back To Top