skip to Main Content

تشخیص تقلب در کارت اعتباری با استفاده از تکنیک‌های یادگیری ماشین:

عنوان انگلیسی: Credit card fraud detection using machine learning techniques: A comparative analysis
سال نشر: ۲۰۱۷
نویسنده: John O. Awoyemi,Adebayo O. Adetunmbi,Samuel A. Oluwadare
تعداد صفحه فارسی: ۱ – تعداد صفحه انگلیسی: ۹
دانشگاه: Department of Computer Science, Federal University of Technology Akure, Akure, Nigeria-
نشریه: Process Safety and Environmental Protection
کیفیت ترجمه: ترجمه پلاس

چکیده

کلاهبرداری مالی تهدیدی روزافزون با پیامدهای بسیار زیاد در صنعت مالی است. داده کاوی نقش مهمی در تشخیص تقلب در کارت اعتباری در معاملات آنلاین ایفا کرده‌است. تشخیص تقلب در کارت اعتباری، که یک مساله داده کاوی است، به دو دلیل عمده چالش برانگیز است – اول، پروفایل های رفتارهای عادی و کلاهبردارانه که به طور مداوم تغییر می‌کنند و ثانیا مجموعه داده های تقلب کارت اعتباری به شدت نامتوازن می‌شود. عملکرد تشخیص تقلب در معاملات کارت اعتباری به میزان زیادی تحت‌تاثیر رویکرد نمونه‌برداری در مجموعه داده، انتخاب متغیرها و روش های تشخیص استفاده شده می باشد. این مقاله عملکرد نایو بیز، نزدیک‌ترین همسایه K، و رگرسیون لجستیک را بر داده‌های شدیداً نامتقارن کلاهبرداری کارت اعتباری بررسی می‌کند. مجموعه داده های تراکنش های کارت اعتباری از دارندگان کارتهای اروپایی که شامل ۲۸۴،۸۰۷ تراکنش هستند، تامین می‌شود. یک تکنیک ترکیبی که شامل بیش نمونه‌گیری و نمونه‌گیری کند بر روی داده‌های نامتقارن است انجام می‌شود. این سه تکنیک بر روی داده‌های خام و پیش پردازش شده اعمال می‌شوند. کار در پایتون پیاده سازی و اجرا می‌شود. کارایی

Abstract

Financial fraud is an ever growing menace with far consequences in the financial industry. Data mining had played an imperative role in the detection of credit card fraud in online transactions. Credit card fraud detection, which is a data mining problem, becomes challenging due to two major reasons – first, the profiles of normal and fraudulent behaviours change constantly and secondly, credit card fraud data sets are highly skewed. The performance of fraud detection in credit card transactions is greatly affected by the sampling approach on dataset, selection of variables and detection technique(s) used. This paper investigates the performance of naïve bayes, k-nearest neighbor and logistic regression on highly skewed credit card fraud data. Dataset of credit card transactions is sourced from European cardholders containing 284,807 transactions. A hybrid technique of under-sampling and oversampling is carried out on the skewed data. The three techniques are applied on the raw
امتیاز شما:
(No Ratings Yet)
Back To Top