skip to Main Content

شمارش جمعیت با توجه به شبکه عصبی پیچشی محرک

عنوان انگلیسی: Crowd counting with crowd attention convolutional neural network
سال نشر: ۲۰۲۰
نویسنده: Jiwei Chen,Wen Su,Zengfu Wang
تعداد صفحه فارسی: ۱۲ – تعداد صفحه انگلیسی: ۹
دانشگاه: Institute of Intelligent Machines, Chinese Academy of Sciences, Hefei, China b Department of Automation, University of Science and Technology of China, Hefei, China c Faculty of Mechanical Engineering and Automation, Zhejiang Sci-Tech University, Hangzhou, China
نشریه: Process Safety and Environmental Protection
کیفیت ترجمه: اقتصادی

چکیده

شمارش جمعیت به دلیل پیچیدگی صحنه و تنوع در مقیاس، یک مشکل چالش برانگیز است. اگرچه یادگیری عمیق به بهبود زیادی در شمارش جمعیت دست یافته‌است، پیچیدگی صحنه بر قضاوت این روش‌ها تاثیر می‌گذارد و آن‌ها معمولا بعضی از اشیا را به اشتباه به عنوان افراد در نظر می‌گیرند. باعث ایجاد خطاهای بالقوه زیادی در نتایج شمارش جمعیت می‌شود. برای حل این مشکل، ما یک مدل جبینایی انتها به انتها به نام شبکه عصبی پیچشیال (‏CAT – CNN)‏پیشنهاد می‌کنیم. CAT – CNN ما می‌تواند به طور تطبیقی اهمیت سر انسان را در هر موقعیت پیکسل با کدگذاری خودکار نگاشت اطمینان ارزیابی کند. با هدایت نگاشت اطمینان، موقعیت سر انسان در نگاشت چگالی تخمینی توجه بیشتری را به کدگذاری نگاشت چگالی نهایی جلب می‌کند که می‌تواند از قضاوت‌های نادرست گسترده به طور موثر جلوگیری کند. شمارش جمعیت را می توان با ادغام نگاشت چگالی نهایی به دست آورد. برای کدگذاری یک نگاشت تراکم بسیار پالایش‌شده، تعداد کل جمعیت هر تصویر در یک کار طبقه‌بندی طراحی‌شده طبقه‌بندی می‌شود و ما ابتدا به طور صریح قبل از رده جمعیت را به نگاشت‌های ویژگی هدایت می‌کنیم. برای تایید کارآمد

Abstract

Crowd counting is a challenging problem due to the scene complexity and scale variation. Although deep learning has achieved great improvement in crowd counting, scene complexity affects the judgement of these methods and they usually regard some objects as people mistakenly; causing potentially enormous errors in the crowd counting result. To address the problem, we propose a novel end-to-end model called Crowd Attention Convolutional Neural Network (CAT-CNN). Our CAT-CNN can adaptively assess the importance of a human head at each pixel location by automatically encoding a confidence map. With the guidance of the confidence map, the position of human head in estimated density map gets more attention to encode the final density map, which can avoid enormous misjudgements effectively. The crowd count can be obtained by integrating the final density map. To encode a highly refined density map, the total crowd count of each image is classified in a designed classification task and we fir
امتیاز شما:
(No Ratings Yet)
Back To Top