عنوان انگلیسی: Deep reinforcement learning for drone navigation using sensor data
سال نشر: ۲۰۲۰
نویسنده: Victoria J. Hodge,Richard Hawkins,Rob Alexander
تعداد صفحه فارسی: ۲۷ – تعداد صفحه انگلیسی: ۱۹
دانشگاه: Department of Computer Science, University of York, York, YO10 5GH, UK
نشریه: Process Safety and Environmental Protection
کیفیت ترجمه: ترجمه پلاس
چکیده
روباتهای متحرک مانند وسایل نقلیه هوایی بدون سرنشین (هواپیماهای بدون سرنشین) میتوانند برای نظارت، نظارت و جمعآوری دادهها در ساختمانها، زیرساختها و محیط مورد استفاده قرار گیرند. اهمیت نظارت دقیق و چند جانبه به خوبی شناخته شدهاست تا مشکلات را زود تشخیص داده و از افزایش آنها جلوگیری شود. این امر نیاز به روباتهای متحرک انعطافپذیر، خودمختار و قدرتمند تصمیمگیری را تحریک میکند. این سیستمها باید قادر به یادگیری از طریق استفاده از دادههای منابع چندگانه باشند. تا همین اواخر، آنها مخصوص کار بودهاند. در این مقاله، ما یک الگوریتم ناوبری عمومی را توصیف میکنیم که از دادههای حسگرهای روی عرشه هواپیماهای بدون سرنشین برای هدایت هواپیماهای بدون سرنشین به محل مشکل استفاده میکند. در وضعیتهای خطرناک و حساس به ایمنی، تعیین دقیق و سریع مشکلات حیاتی است. ما از الگوریتم بهینهسازی سیاست مجاور یادگیری تقویتی عمیق همراه با یادگیری برنامهدرسی افزایشی و شبکههای عصبی حافظه کوتاهمدت بلند مدت برای اجرای الگوریتم جهتیابی عمومی و سازگار استفاده میکنیم. ما پیکربندیهای مختلف را در برابر یک روش اکت
Abstract
Mobile robots such as unmanned aerial vehicles (drones) can be used for surveillance, monitoring and data collection in buildings, infrastructure and environments. The importance of accurate and multifaceted monitoring is well known to identify problems early and prevent them escalating. This motivates the need for flexible, autonomous and powerful decision-making mobile robots. These systems need to be able to learn through fusing data from multiple sources. Until very recently, they have been task specific. In this paper, we describe a generic navigation algorithm that uses data from sensors on-board the drone to guide the drone to the site of the problem. In hazardous and safety-critical situations, locating problems accurately and rapidly is vital. We use the proximal policy optimisation deep reinforcement learning algorithm coupled with incremental curriculum learning and long short-term memory neural networks to implement our generic and adaptable navigation algorithm. We evaluat
امتیاز شما: