تکنیک های دادهکاوی در سهمیهبندی مناطق برای کنکور
محورهای موضوعی : تخصصینرجس سرعتی آَشتیانی 1 * , سمیه علیزاده 2 , علی مبصّـری 3
1 - موسسه مطالعات بین المللی انرژی ( وزارت نفت)
2 - دانشگاه خواجه¬ نصیرالدّین طوسی
3 -
کلید واژه: دادهکاوی, تحلیل خوشهای, پیشبینی, توسعهیافتگی, سهمیهبندی مناطق,
چکیده مقاله :
تعداد زیادی از فارغالتحصیلان دبیرستانها در سیستم آموزشی ایران خواهان ورود به دانشگاهها میباشند و رقابت اصلی برای ورود به مراکز دانشگاهی معتبر میباشد. از سویی دیگر تسهیلات آموزشی، بهداشتی و ... در تمامی شهرها توزیعی مناسب ندارند. مدیران سازمانهای ذیربط، تخصیص سهمیه را راهکاری مناسب برای حل این مسأله میدانند و به دنبال استفاده از دانش نهفته در دادههای موجود در این حوزه هستند. با منطقهبندی کلیه بخشهای کشور، داوطلبان هر منطقه با هم مقایسه میشوند و در واقع با این روش از اینکه درصد پذیرفتهشدگان یک شهر چند برابر شهر دیگری باشد، جلوگیری میشود. تعیین میزان سهمیه کنکور برای بخشهای کشور در سال های اخیر، برمبنای میزان توسعهیافتگی مناطق با استفاده از روش تاکسونومی صورت گرفته است که خروجی حاصل از این روش نوعی رتبهبندی مناطق میباشد که در آن امکان تحلیل گروهی مناطق وجود ندارد، همچنین تعداد مناطق بصورت نظری تعیین می شود. برای رفع این مسائل بخشبندی میتواند به عنوان یک راهکار مناسب مورد استفاده قرار گیرد. تحقیق حاضر برای اولین بار در حوزه توسعهیافتگی، با استفاده از تکنیکهای دادهکاوی و روش کریسپ و در قالب متدولوژی پیشنهادی، بر روی دادههای مرتبط، در وزارت آموزش و پرورش، وزارت کشور، وزارت بهداشت و درمان، مرکز آمار و سازمان سنجش، صورت گرفته است. پس از شناسایی استانداردها و شاخصهای اثرگذار در این زمینه، آمادهسازی دادهها انجام شده و به ساخت انبارهداده و ترکیب شاخصها جهت استخراج عوامل جدید پرداخته شده است. در گام بعدی با بکارگیری الگوریتم K-means بخشهای شبیه به هم در خوشههای مربوطه قرار گرفته و سپس با استفاده از روش پیشبینی شبکه های عصبی و درخت تصمیم امکان اختصاص بخشهای جدید به هر کلاس (خوشههای ایجاد شده) فراهم شده و جهت ارزیابی مدلهای ایجاد شده، دقت خروجی با سایر روشها مقایسه شده است. دستاوردهای این تحقیق عبارتند از: تعیین تعداد بهینه بخشها، بخشبندی مناطق، تحلیل هر بخش، استخراج قواعد تصمیمگیری، امکان پیشبینی سریعتر و دقیقتر برچسب کلاس برای مناطق جدید، فراهم نمودن امکان تدوین راهبردهای مناسب برای هر بخش.
The large numbers of Iranian high school graduates are willing to enter in governmental and popular colleges and compete for it. On the other hand, these graduate students are from various regions with different levels of access to facilities. In opinion of directors of relevant agencies, the quota allocation solves this problem and they are looking to use the knowledge hidden in the data are available in this area.By this way volunteers from each region are compared together and managers are helped to allocate proper quota to related students in regions of each segment. In recent years, quota allocation was determined by Taxonomy that its result is a kind of ranking that does not allow group analyzing and identifies number of region theoretically. To solve this problem clustering is a good strategy. This study is carried out by using data mining techniques and Crisp methods on related dataset from education ministry, interior ministry, ministry of health, and center of statistic and evaluation organization for the first time. After extracting of effective attributes in this area, data preparation, data reduction and combination of attributes using Factor Analysis have done.in next step, by using K-means algorithm, similar items assign in to a cluster that has the minimum distance with centroid mean and then by using neural networks and decision trees, new item can be devoted to each cluster. Finally for assessing created models, accuracy of outputs compared with other methods. Outcomes of this research are: determining the optimal number of sectors, segmenting regions, analyzing each section, extracting decision rules, predicting class labels for new areas faster and more accurately, allowing the appropriate strategies formulation for each section