عنوان انگلیسی: Improving educational web search for question-like queries through subject classification
سال نشر: ۲۰۱۹
نویسنده: Tolga Yilmaz,Rifat Ozcan,Ismail Sengor Altingovde,Özgür Ulusoy
تعداد صفحه فارسی: ۳۹ – تعداد صفحه انگلیسی: ۱۹
دانشگاه: Department of Computer Engineering, Bilkent University, Ankara 06800, Turkey b Ntent, Inc., Av. Diagonal 210, Barcelona 08018, Spain c Department of Computer Engineering, Middle East Technical University, Ankara 06800, Turkey
نشریه: Process Safety and Environmental Protection
کیفیت ترجمه: ترجمه پلاس
چکیده
دانش آموزان از موتورهای جستجوی عمومی وب به عنوان منبع اولیه تحقیقات خود استفاده میکنند در حالی که سعی میکنند به سوالات مربوط به مدرسه پاسخ دهند. اگر چه موتورهای جستجو بسیار مرتبط با جمعیت عمومی هستند، اما ممکن است نتایجی را که خارج از زمینه آموزشی هستند، بازگردانند. یک روند رو به رشد دیگر؛ وب سایتهای پاسخگویی به سوالات انجمن اجتماعی انتخاب دوم برای دانش آموزانی است که سعی در گرفتن پاسخ از دیگر همتایان آنلاین دارند. ما تلاش میکنیم تا پیشرفتهای ممکن در جستجوی آموزشی را با استفاده از هر دو منبع اطلاعاتی کشف کنیم. برای این منظور، ابتدا یک طبقهبندی کننده برای سوالات آموزشی اجرا میکنیم. این طبقه بندی کننده با یک روش گروهی ساخته میشود که از چندین الگوریتم یادگیری منظم و رویکردهای مبتنی بر بازیابی که از منابع خارجی استفاده میکنند، استفاده میکند. ما همچنین یک بسط دهنده جستجو برای تسهیل طبقهبندی ایجاد میکنیم. ما طبقهبندی را با استفاده از نتایج موتور جستجو بهبود میدهیم و دقت ۵ / ۸۳ % به دست میآوریم. اگرچه کار ما به طور کامل بر پایه زبان ترکی است، اما ویژگیها را می توان به راحتی به
Abstract
Highlights•We build an educational subject classifier for queries. There is no publicly available dataset for such queries in Turkish. Therefore we utilize educational questions posted in educational Q&A websites and manually label them with educational subjects. Since students also tend to submit natural language queries, questions can be safely regarded as queries.•We utilize a diverse set of lexical, syntactic and semantic features, query results from a search engine and query expansion for classifying educational subject of queries at a resulting 83.58% accuracy.•We propose point-wise and list-wise re-ranking mechanisms that optimize the ranking order based on predictions of the educational subject classifier. Two of our re-ranking methods achieve statistically significant results in Normalized Discounted Cumulative Gain (NDCG) metric compared to the original ranking obtained from a large-scale commercial web search engine.•To the best of our knowledge, this is thefirst manuscript
امتیاز شما: