عنوان انگلیسی: Attend to count: Crowd counting with adaptive capacity multi-scale CNNs
سال نشر: ۲۰۱۹
نویسنده: Zhikang Zou,Yu Cheng,Xiaoye Qu,Shouling Ji,Xiaoxiao Guo,Pan Zhou
تعداد صفحه فارسی: ۷ – تعداد صفحه انگلیسی: ۴
دانشگاه: School of Electronic Information and Communication, Huazhong University of Science and Technology, China b Microsoft Research & AI, China c College of Computer Science and Technology, Zhejiang University, China d IBM & AI Foundations Learning, China
نشریه: Process Safety and Environmental Protection
کیفیت ترجمه: اقتصادی
چکیده
شمارش جمعیت یک کار چالش برانگیز به دلیل تنوع زیاد در توزیع جمعیت است. روشهای قبلی تمایل به مقابله با کل تصویر با یک ساختار ثابت واحد دارند، که قادر به کنترل صحنههای پیچیده متنوع با تراکمهای مختلف جمعیت نیست. بنابراین، ما شبکههای عصبی پیجشی چند مقیاسی ظرفیت انطباقی (ACM – CNN)را پیشنهاد میکنیم، یک رویکرد شمارش جمعیت جدید که میتواند ظرفیتهای مختلف را به بخشهای مختلف ورودی اختصاص دهد. حدس این است که این مدل باید بر روی مناطق مهم تصویر ورودی و بهینهسازی شرایط تخصیص ظرفیت آن بر روی درجه تراکم متمرکز شود. ACM – CNN از سه نوع ماژول تشکیل شدهاست: یک شبکه ناهنجار، یک شبکه خوب، و یک شبکه نرم. شبکه ناهنجار برای کشف مناطقی که نیاز به تمرکز دارند از طریق مکانیسم توجه شمارش، و ایجاد یک نگاشت ویژگی ناهنجار استفاده میشود. سپس شبکه خوب نواحی مورد نظر را به یک نگاشت مشخصه خوب تبدیل میکند. برای کاهش حس تقسیم ناشی از ترکیب، شبکه هموار برای ترکیب دو نگاشت ویژگی به صورت ارگانیک برای تولید نگاشتهای چگالی با کیفیت بالا طراحی شدهاست. آزمایشها گستردهای بر روی پنج مجموعه داده اصلی انجام شدهاست
Abstract
Crowd counting is a challenging task due to the large variations in crowd distributions. Previous methods tend to tackle the whole image with a single fixed structure, which is unable to handle diverse complicated scenes with different crowd densities. Hence, we propose the Adaptive Capacity Multi-scale convolutional neural networks (ACM-CNN), a novel crowd counting approach which can assign different capacities to different portions of the input. The intuition is that the model should focus on important regions of the input image and optimize its capacity allocation conditioning on the crowd intensive degree. ACM-CNN consists of three types of modules: A coarse network, a fine network, and a smooth network. The coarse network is used to explore the areas that need to be focused via count attention mechanism, and generate a rough feature map. Then the fine network processes the areas of interest into a fine feature map. To alleviate the sense of division caused by fusion, the smooth ne
امتیاز شما: