تکنیک های داده‌کاوی در سهمیه‌بندی مناطق برای کنکور

محورهای موضوعی : Special

نرجس سرعتی آَشتیانی ^{1
*} , سمیه علیزاده ² , علی مبصّـری ³

1 - موسسه مطالعات بین المللی انرژی ( وزارت نفت)
2 - دانشگاه خواجه¬ نصیرالدّین طوسی
3 -

تاریخ دریافت : 1393/04/02 تاریخ انتشار : 1398/08/17

کلید واژه: داده‌کاوی, تحلیل خوشه‌ای, پیش‌بینی, توسعه‌یافتگی, سهمیه‌بندی مناطق,

چکیده مقاله :

تعداد زیادی از فارغ‌التحصیلان دبیرستان‌ها در سیستم آموزشی ایران خواهان ورود به دانشگاه‌ها می‌باشند و رقابت اصلی برای ورود به مراکز دانشگاهی معتبر می‌باشد. از سویی دیگر تسهیلات آموزشی، بهداشتی و ... در تمامی شهرها توزیعی مناسب ندارند. مدیران سازمان‌های ذیربط، تخصیص سهمیه را راه‌کاری مناسب برای حل این مسأله می‌دانند و به دنبال استفاده از دانش نهفته در داده‌های موجود در این حوزه هستند. با منطقه‌بندی کلیه بخش‌های کشور، داوطلبان هر منطقه با هم مقایسه می‌شوند و در واقع با این روش از اینکه درصد پذیرفته‌شدگان یک شهر چند برابر شهر دیگری باشد، جلوگیری می‌شود. تعیین میزان سهمیه کنکور برای بخش‌های کشور در سال های اخیر، برمبنای میزان توسعه‌یافتگی مناطق با استفاده از روش تاکسونومی صورت گرفته است که خروجی حاصل از این روش نوعی رتبه‌بندی مناطق می‌باشد که در آن امکان تحلیل گروهی مناطق وجود ندارد، همچنین تعداد مناطق بصورت نظری تعیین می شود. برای رفع این مسائل بخش‌بندی می‌تواند به عنوان یک راهکار مناسب مورد استفاده قرار گیرد. تحقیق حاضر برای اولین بار در حوزه توسعه‌یافتگی، با استفاده از تکنیک‌های داده‌کاوی و روش کریسپ و در قالب متدولوژی پیشنهادی، بر روی داده‌های مرتبط، در وزارت آموزش‌ و پرورش، وزارت کشور، وزارت بهداشت و درمان، مرکز آمار و سازمان سنجش، صورت گرفته است. پس از شناسایی استانداردها و شاخص‌های اثرگذار در این زمینه، آماده‌سازی داده‌ها انجام شده و به ساخت انباره‌داده و ترکیب شاخص‌ها جهت استخراج عوامل جدید پرداخته شده است. در گام بعدی با بکارگیری الگوریتم K-means بخش‌های شبیه به هم در خوشه‌های مربوطه قرار گرفته و سپس با استفاده از روش پیش‌بینی شبکه های عصبی و درخت تصمیم امکان اختصاص بخش‌های جدید به هر کلاس (خوشه‌های ایجاد شده) فراهم شده و جهت ارزیابی مدل‌های ایجاد شده، دقت خروجی با سایر روش‌ها مقایسه شده است. دستاوردهای این تحقیق عبارتند از: تعیین تعداد بهینه بخش‌ها، بخش‌بندی مناطق، تحلیل هر بخش، استخراج قواعد تصمیم‌گیری، امکان پیش‌بینی سریع‌تر و دقیق‌تر برچسب کلاس برای مناطق جدید، فراهم نمودن امکان تدوین راهبرد‌های مناسب برای هر بخش.

چکیده انگلیسی:

The large numbers of Iranian high school graduates are willing to enter in governmental and popular colleges and compete for it. On the other hand, these graduate students are from various regions with different levels of access to facilities. In opinion of directors of relevant agencies, the quota allocation solves this problem and they are looking to use the knowledge hidden in the data are available in this area.By this way volunteers from each region are compared together and managers are helped to allocate proper quota to related students in regions of each segment. In recent years, quota allocation was determined by Taxonomy that its result is a kind of ranking that does not allow group analyzing and identifies number of region theoretically. To solve this problem clustering is a good strategy. This study is carried out by using data mining techniques and Crisp methods on related dataset from education ministry, interior ministry, ministry of health, and center of statistic and evaluation organization for the first time. After extracting of effective attributes in this area, data preparation, data reduction and combination of attributes using Factor Analysis have done.in next step, by using K-means algorithm, similar items assign in to a cluster that has the minimum distance with centroid mean and then by using neural networks and decision trees, new item can be devoted to each cluster. Finally for assessing created models, accuracy of outputs compared with other methods. Outcomes of this research are: determining the optimal number of sectors, segmenting regions, analyzing each section, extracting decision rules, predicting class labels for new areas faster and more accurately, allowing the appropriate strategies formulation for each section

منابع و مأخذ:

اشتراک گذاری

آدرس مقاله

تکنیک های داده‌کاوی در سهمیه‌بندی مناطق برای کنکور