عنوان انگلیسی: Credit card fraud detection using machine learning techniques: A comparative analysis
سال نشر: ۲۰۱۷
نویسنده: John O. Awoyemi,Adebayo O. Adetunmbi,Samuel A. Oluwadare
تعداد صفحه فارسی: ۱ – تعداد صفحه انگلیسی: ۹
دانشگاه: Department of Computer Science, Federal University of Technology Akure, Akure, Nigeria-
نشریه: Process Safety and Environmental Protection
کیفیت ترجمه: ترجمه پلاس
چکیده
کلاهبرداری مالی تهدیدی روزافزون با پیامدهای بسیار زیاد در صنعت مالی است. داده کاوی نقش مهمی در تشخیص تقلب در کارت اعتباری در معاملات آنلاین ایفا کردهاست. تشخیص تقلب در کارت اعتباری، که یک مساله داده کاوی است، به دو دلیل عمده چالش برانگیز است – اول، پروفایل های رفتارهای عادی و کلاهبردارانه که به طور مداوم تغییر میکنند و ثانیا مجموعه داده های تقلب کارت اعتباری به شدت نامتوازن میشود. عملکرد تشخیص تقلب در معاملات کارت اعتباری به میزان زیادی تحتتاثیر رویکرد نمونهبرداری در مجموعه داده، انتخاب متغیرها و روش های تشخیص استفاده شده می باشد. این مقاله عملکرد نایو بیز، نزدیکترین همسایه K، و رگرسیون لجستیک را بر دادههای شدیداً نامتقارن کلاهبرداری کارت اعتباری بررسی میکند. مجموعه داده های تراکنش های کارت اعتباری از دارندگان کارتهای اروپایی که شامل ۲۸۴،۸۰۷ تراکنش هستند، تامین میشود. یک تکنیک ترکیبی که شامل بیش نمونهگیری و نمونهگیری کند بر روی دادههای نامتقارن است انجام میشود. این سه تکنیک بر روی دادههای خام و پیش پردازش شده اعمال میشوند. کار در پایتون پیاده سازی و اجرا میشود. کارایی
Abstract
Financial fraud is an ever growing menace with far consequences in the financial industry. Data mining had played an imperative role in the detection of credit card fraud in online transactions. Credit card fraud detection, which is a data mining problem, becomes challenging due to two major reasons – first, the profiles of normal and fraudulent behaviours change constantly and secondly, credit card fraud data sets are highly skewed. The performance of fraud detection in credit card transactions is greatly affected by the sampling approach on dataset, selection of variables and detection technique(s) used. This paper investigates the performance of naïve bayes, k-nearest neighbor and logistic regression on highly skewed credit card fraud data. Dataset of credit card transactions is sourced from European cardholders containing 284,807 transactions. A hybrid technique of under-sampling and oversampling is carried out on the skewed data. The three techniques are applied on the raw
امتیاز شما: