عنوان انگلیسی: Data Analysis Support by Combining Data Mining and Text Mining
سال نشر: ۲۰۱۷
نویسنده: Tomoya Matsumoto,Wataru Sunayama,Yuji Hatanaka,Kazunori Ogohara
تعداد صفحه فارسی: ۸ – تعداد صفحه انگلیسی: ۶
دانشگاه: The University of Shiga Prefecture, 2500, Hassaka-cho, Hikone, Shiga 522-8533, Japan
نشریه: Process Safety and Environmental Protection
کیفیت ترجمه: اقتصادی
چکیده
در سالهای اخیر تکنیکهای داده کاوی و استخراج متن به کرات برای تجزیه و تحلیل پرسشنامه و مرور اطلاعات مورد استفاده قرار گرفتهاند. تکنیکهای داده کاوی مانند تحلیل ارتباط و تحلیل خوشهای برای تحلیل بازاریابی مورد استفاده قرار میگیرند، زیرا آنها میتوانند روابط و قوانینی را کشف کنند که در دادههای عددی بزرگ پنهان شدهاند. از طرف دیگر، تکنیکهای داده کاوی مانند استخراج کلمات کلیدی و استخراج عقیده برای پرسشنامه و یا تحلیل متن مورد استفاده قرار میگیرند، زیرا آنها میتوانند از ما برای بررسی نظر مصرف کنندگان در دادههای متنی پشتیبانی کنند. با این حال، ابزارهای داده کاوی و ابزارهای کاوش متن را نمی توان در یک محیط واحد مورد استفاده قرار داد. بنابراین، دادههایی که دادههای عددی و هم متنی دارند به خوبی تحلیل نشده اند، زیرا بخش عددی و بخش متنی را نمی توان به تفسیر متصل کرد.
در این مقاله، یک چارچوب استخراج که میتواند با دادههای عددی و هم متنی رفتار کند، پیشنهاد شدهاست. ما می توانیم داده های کوچک و تجزیه و تحلیل داده ها را با ابزار تحلیل عددی و متن در چارچوب منحصر به فرد انجام دهیم.
در این مقاله، یک چارچوب استخراج که میتواند با دادههای عددی و هم متنی رفتار کند، پیشنهاد شدهاست. ما می توانیم داده های کوچک و تجزیه و تحلیل داده ها را با ابزار تحلیل عددی و متن در چارچوب منحصر به فرد انجام دهیم.
Abstract
In recent years, data mining and text mining techniques have been frequently used for analyzing questionnaire and review data. Data mining techniques such as association analysis and cluster analysis are used for marketing analysis, because those can discover relationships and rules hiding in enormous numerical data. On the other hand, text mining techniques such as keywords extraction and opinion extraction are used for questionnaire or review text analysis, because those can support us to investigate consumers opinion in text data. However, data mining tools and text mining tools cannot be used in a single environment. Therefore, a data which has both numerical and text data is not well analyzed because the numerical part and text part cannot be connected for interpretation. In this paper, a mining framework that can treat both numerical and text data is proposed. We can iterate data shrink and data analysis with both numerical and text analysis tools in the unique framework.
امتیاز شما: