skip to Main Content

تمایل به شمارش: شمارش جمعیت با ظرفیت تطبیقی چند مقیاسی CNNها

عنوان انگلیسی: Attend to count: Crowd counting with adaptive capacity multi-scale CNNs
سال نشر: ۲۰۱۹
نویسنده: Zhikang Zou,Yu Cheng,Xiaoye Qu,Shouling Ji,Xiaoxiao Guo,Pan Zhou
تعداد صفحه فارسی: ۷ – تعداد صفحه انگلیسی: ۴
دانشگاه: School of Electronic Information and Communication, Huazhong University of Science and Technology, China b Microsoft Research & AI, China c College of Computer Science and Technology, Zhejiang University, China d IBM & AI Foundations Learning, China
نشریه: Process Safety and Environmental Protection
کیفیت ترجمه: اقتصادی

چکیده

شمارش جمعیت یک کار چالش برانگیز به دلیل تنوع زیاد در توزیع جمعیت است. روش‌های قبلی تمایل به مقابله با کل تصویر با یک ساختار ثابت واحد دارند، که قادر به کنترل صحنه‌های پیچیده متنوع با تراکم‌های مختلف جمعیت نیست. بنابراین، ما شبکه‌های عصبی پیجشی چند مقیاسی ظرفیت انطباقی (‏ACM – CNN)‏را پیشنهاد می‌کنیم، یک رویکرد شمارش جمعیت جدید که می‌تواند ظرفیت‌های مختلف را به بخش‌های مختلف ورودی اختصاص دهد. حدس این است که این مدل باید بر روی مناطق مهم تصویر ورودی و بهینه‌سازی شرایط تخصیص ظرفیت آن بر روی درجه تراکم متمرکز شود. ACM – CNN از سه نوع ماژول تشکیل شده‌است: یک شبکه ناهنجار، یک شبکه خوب، و یک شبکه نرم. شبکه ناهنجار برای کشف مناطقی که نیاز به تمرکز دارند از طریق مکانیسم توجه شمارش، و ایجاد یک نگاشت ویژگی ناهنجار استفاده می‌شود. سپس شبکه خوب نواحی مورد نظر را به یک نگاشت مشخصه خوب تبدیل می‌کند. برای کاهش حس تقسیم ناشی از ترکیب، شبکه هموار برای ترکیب دو نگاشت ویژگی به صورت ارگانیک برای تولید نگاشت‌های چگالی با کیفیت بالا طراحی شده‌است. آزمایش‌ها گسترده‌ای بر روی پنج مجموعه داده اصلی انجام شده‌است

Abstract

Crowd counting is a challenging task due to the large variations in crowd distributions. Previous methods tend to tackle the whole image with a single fixed structure, which is unable to handle diverse complicated scenes with different crowd densities. Hence, we propose the Adaptive Capacity Multi-scale convolutional neural networks (ACM-CNN), a novel crowd counting approach which can assign different capacities to different portions of the input. The intuition is that the model should focus on important regions of the input image and optimize its capacity allocation conditioning on the crowd intensive degree. ACM-CNN consists of three types of modules: A coarse network, a fine network, and a smooth network. The coarse network is used to explore the areas that need to be focused via count attention mechanism, and generate a rough feature map. Then the fine network processes the areas of interest into a fine feature map. To alleviate the sense of division caused by fusion, the smooth ne
امتیاز شما:
(No Ratings Yet)
Back To Top