• فهرست مقالات Data mining

      • دسترسی آزاد مقاله

        1 - تکنیک های داده‌کاوی در سهمیه‌بندی مناطق برای کنکور
        نرجس سرعتی آَشتیانی سمیه علیزاده علی  مبصّـری
        تعداد زیادی از فارغ‌التحصیلان دبیرستان‌ها در سیستم آموزشی ایران خواهان ورود به دانشگاه‌ها می‌باشند و رقابت اصلی برای ورود به مراکز دانشگاهی معتبر می‌باشد. از سویی دیگر تسهیلات آموزشی، بهداشتی و ... در تمامی شهرها توزیعی مناسب ندارند. مدیران سازمان‌های ذیربط، تخصیص سهمیه چکیده کامل
        تعداد زیادی از فارغ‌التحصیلان دبیرستان‌ها در سیستم آموزشی ایران خواهان ورود به دانشگاه‌ها می‌باشند و رقابت اصلی برای ورود به مراکز دانشگاهی معتبر می‌باشد. از سویی دیگر تسهیلات آموزشی، بهداشتی و ... در تمامی شهرها توزیعی مناسب ندارند. مدیران سازمان‌های ذیربط، تخصیص سهمیه را راه‌کاری مناسب برای حل این مسأله می‌دانند و به دنبال استفاده از دانش نهفته در داده‌های موجود در این حوزه هستند. با منطقه‌بندی کلیه بخش‌های کشور، داوطلبان هر منطقه با هم مقایسه می‌شوند و در واقع با این روش از اینکه درصد پذیرفته‌شدگان یک شهر چند برابر شهر دیگری باشد، جلوگیری می‌شود. تعیین میزان سهمیه کنکور برای بخش‌های کشور در سال های اخیر، برمبنای میزان توسعه‌یافتگی مناطق با استفاده از روش تاکسونومی صورت گرفته است که خروجی حاصل از این روش نوعی رتبه‌بندی مناطق می‌باشد که در آن امکان تحلیل گروهی مناطق وجود ندارد، همچنین تعداد مناطق بصورت نظری تعیین می شود. برای رفع این مسائل بخش‌بندی می‌تواند به عنوان یک راهکار مناسب مورد استفاده قرار گیرد. تحقیق حاضر برای اولین بار در حوزه توسعه‌یافتگی، با استفاده از تکنیک‌های داده‌کاوی و روش کریسپ و در قالب متدولوژی پیشنهادی، بر روی داده‌های مرتبط، در وزارت آموزش‌ و پرورش، وزارت کشور، وزارت بهداشت و درمان، مرکز آمار و سازمان سنجش، صورت گرفته است. پس از شناسایی استانداردها و شاخص‌های اثرگذار در این زمینه، آماده‌سازی داده‌ها انجام شده و به ساخت انباره‌داده و ترکیب شاخص‌ها جهت استخراج عوامل جدید پرداخته شده است. در گام بعدی با بکارگیری الگوریتم K-means بخش‌های شبیه به هم در خوشه‌های مربوطه قرار گرفته و سپس با استفاده از روش پیش‌بینی شبکه های عصبی و درخت تصمیم امکان اختصاص بخش‌های جدید به هر کلاس (خوشه‌های ایجاد شده) فراهم شده و جهت ارزیابی مدل‌های ایجاد شده، دقت خروجی با سایر روش‌ها مقایسه شده است. دستاوردهای این تحقیق عبارتند از: تعیین تعداد بهینه بخش‌ها، بخش‌بندی مناطق، تحلیل هر بخش، استخراج قواعد تصمیم‌گیری، امکان پیش‌بینی سریع‌تر و دقیق‌تر برچسب کلاس برای مناطق جدید، فراهم نمودن امکان تدوین راهبرد‌های مناسب برای هر بخش. پرونده مقاله
      • دسترسی آزاد مقاله

        2 - بررسی ابعاد مختلف مسئله شناسایی وب سایت فیشینگ و مرور روش‌های موجود
        نفیسه لنگری
        یکی از جدیدترین تهدیدات امنیتی در فضای مجازی، سرقت اطلاعات شخصی و مالی افراد توسط فیشرها می‌باشد. وجود روش‌های متنوع در شناسایی فیشینگ و عدم وجود مقاله جامع و به روز در این حوزه، نویسندگان این مقاله را برآن داشت تا با مرور، بررسی و تحلیل عملکردی روش‌های ارائه شده در پنج چکیده کامل
        یکی از جدیدترین تهدیدات امنیتی در فضای مجازی، سرقت اطلاعات شخصی و مالی افراد توسط فیشرها می‌باشد. وجود روش‌های متنوع در شناسایی فیشینگ و عدم وجود مقاله جامع و به روز در این حوزه، نویسندگان این مقاله را برآن داشت تا با مرور، بررسی و تحلیل عملکردی روش‌های ارائه شده در پنج گروه، به ارائه مزایا و معایب هر کدام از روش‌های این گروه‌های پنج گانه بپردازند. نتایج این تحقیق گسترده می‌تواند در شناسایی گپ‌های موجود در این حوزه به محققین کمک فراوانی نماید پرونده مقاله
      • دسترسی آزاد مقاله

        3 - تلفیق مدل تحلیل پوششی داده ها و درخت تصمیم به منظور ارزیابی واحدهای مبتنی بر تکنولوژی اطلاعات
        امیر امینی
        هرسازمان به منظور آگاهی از میزان عملکرد و مطلوبیت فعالیت واحدهای خود به یک نظام ارزشیابی جهت سنجش این مطلوبیت نیاز دارد و این موضوع برای مؤسسات مالی از جمله شرکت های مبتنی بر تکنولوژی اطلاعات اهمیت بیشتری دارد. تحلیل پوششی داده ها یک روش غیرپارامتری برای اندازه گیری کار چکیده کامل
        هرسازمان به منظور آگاهی از میزان عملکرد و مطلوبیت فعالیت واحدهای خود به یک نظام ارزشیابی جهت سنجش این مطلوبیت نیاز دارد و این موضوع برای مؤسسات مالی از جمله شرکت های مبتنی بر تکنولوژی اطلاعات اهمیت بیشتری دارد. تحلیل پوششی داده ها یک روش غیرپارامتری برای اندازه گیری کارایی و بهره وری از واحدهای تصمیم گیری (DMUs)هاست. از طرف دیگر تکنیک داده کاوی بهDMUs))ها اجازه کاوش و کشف اطلاعات معنی داری، که قبلاً در پایگاه داده های بزرگ پنهان بوده اند را می دهد. این مقاله یک چارچوب کلی ترکیب تحلیل پوششی داده ها بادرخت رگرسیون را برای ارزیابی کارایی و بهره وری ازDMUها پیشنهاد می کند. نتیجه مدل ترکیبی مجموعه ای از قوانین است که می تواند توسط سیاست گذاران برای کشف دلایلDMUهای کارآمد و ناکارآمد مورد استفاده قرار گیرد. به عنوان مطالعه موردی با استفاده از روش پیشنهادی برای بررسی عوامل مرتبط با بهره وری نمونه ای شامل 18 شعبه از بیمه ایران در شهر تهران انتخاب گردید و پس از مدل سازی بر مبنای مدل پیشرفته LVM ورودی محور با دسترسی پذیری ضعیف درتحلیل پوششی داده ها با خروجی نامطلوب محاسبه گردید و با تکنیک درخت تصمیم، به استخراج قوانین برای کشف دلایل افزایش بهره وری و پسرفت بهره وری می پردازد. پرونده مقاله
      • دسترسی آزاد مقاله

        4 - کشف اسپم در شبکه اجتماعی فیس‌بوک با استفاده از داده‌کاوی
        امین نظری
        در سال‌های اخیر با توسعه‌ی فن‌آوری‌های نوین و ابزارهای ارتباطی جدیدی مانند اینترنت، مفاهیم جدیدی به نام شبکه‌های اجتماعی مجازی به وجود آمدند. رشد سریع و قارچ گونه‌ی شبکه‌های اجتماعی از طرفی و نامشخص بودن هویت واقعی افراد در این شبکه‌ها از طرفی دیگر، بستر مناسبی را برای چکیده کامل
        در سال‌های اخیر با توسعه‌ی فن‌آوری‌های نوین و ابزارهای ارتباطی جدیدی مانند اینترنت، مفاهیم جدیدی به نام شبکه‌های اجتماعی مجازی به وجود آمدند. رشد سریع و قارچ گونه‌ی شبکه‌های اجتماعی از طرفی و نامشخص بودن هویت واقعی افراد در این شبکه‌ها از طرفی دیگر، بستر مناسبی را برای افراد سودجو فراهم نموده است. در اغلب موارد، کلاهبردارن در تلاشند تا انواع مختلف اسپم را در محیط‌هایی با پتانسیل بالا گسترش دهند. به همین دلیل در شبکه‌های اجتماعی نیازمند یک روش موثر برای تشخیص اسپم به منظور افزایش سطح امنیت اطلاعات هستیم. در این مقاله روش جدیدی برای کشف اسپمرها در شبکه‌ اجتماعی فیس‌بوک ارائه می‌دهیم. نتایج حاصل، دقت 99.96% روش پیشنهادی را نشان می‌دهد. در مقالات پیشین کاربران به دودسته‌ی کاربران عادی و کاربران اسپمر تقسیم می‌شوند. روش دسته‌بندی در این مقالات به‌گونه‌ای است که کاربرانی را که موردحمله اسپمرها قرارگرفته‌اند را نیز به‌عنوان اسپمر شناسایی می‌کنند. بنابراین در این مقاله با دسته‌بندی کاربران به سه دسته‌ی کاربران عادی، اسپمرها و کاربرانی که موردحمله اسپمرها قرارگرفته‌اند، صحت تشخیص الگوریتم را افزایش دادیم. پرونده مقاله
      • دسترسی آزاد مقاله

        5 - ارائه مدل داده‌ای مناسب در بانک‌ها به منظور بهره‌گیری از کاربردهای داده‌‌‌کاوی
        شهیده احمدی
        حوزه‌های بانکداری مانند ارزیابی اعتباری، کارایی شعبه‌ها، بانکداری الکترونیکی زمینه‌های فوق العاده‌ای برای کاربرد وسیع مفاهیم هوش تجاری و روش‌های آن شامل داده‌‌کاوی، انباره‌های داده‌ها و سیستم‌های پشتیبانی تصمیم‌گیری می‌باشند. پژوهش‌های زیادی در حوزه کاربرد داده‌کاوی در چکیده کامل
        حوزه‌های بانکداری مانند ارزیابی اعتباری، کارایی شعبه‌ها، بانکداری الکترونیکی زمینه‌های فوق العاده‌ای برای کاربرد وسیع مفاهیم هوش تجاری و روش‌های آن شامل داده‌‌کاوی، انباره‌های داده‌ها و سیستم‌های پشتیبانی تصمیم‌گیری می‌باشند. پژوهش‌های زیادی در حوزه کاربرد داده‌کاوی در زمینه‌های خاصی از بانکداری وجود دارند که هر کدام با استفاده از موجودیت­ های مختلف حوزه بانکداری مانند مشتری، تسهیلات، حساب و غیره به تحلیل پرداخته‌اند. اما پژوهشی که به طور جامع به همه کاربردهای داده‌کاوی در بانک بپردازد، آنها را یکپارچه کند، تمام موجودیت‌های مورد نیاز بانکداری به منظور انواع کاربردهای تحلیلی را استخراج و دسته­ بندی کند و در نهایت با توجه به صفت‌های مورد نیاز حوزه‌های بانکداری به ارائه مدل داده­ای مناسب بپردازد، وجود ندارد. در حال حاضر در بانک­ های ایران، سامانه­ های اطلاعاتی برای پاسخ به نیازهای اطلاعاتی جدید در حال توسعه هستند. در این پژوهش با استفاده از روش تحلیل محتوا، محتوای پژوهش­های معتبر در حوزه بانکداری که با رویکرد داده­ کاوی انجام شده ­اند، مورد بررسی قرار گرفت تا  با استخراج موجودیت­ ها و صفت ­های مورد استفاده این پژوهش­ ها، مدل داده ­ای مناسبی برای کابردهای تحلیل داده ­کاوی در بانکداری ارائه شود. مدیران فن­آوری اطلاعات با استفاده از این مدل م ی­توانند به ارزیابی وضعیت بانک از نظر غنای داده ­های لازم برای انجام تحلیل­ های داده ­کاوی بپردازند و خلاءهای مورد شناسایی را در برنامه ­های توسعه آتی سامانه­ های اطلاعاتی مدنظر قرار دهند. به علاوه، وجود مدل به آنها کمک می­ کند که بدانند برای هر یک از اهداف تجاری بکارگیری داده­ کاوی در بانکداری نیاز به چه اقلام اطلاعاتی وجود دارد. پس از تحلیل و بررسی پژوهش­ های پیشین، نهایتاً  28 موجودیت با 423 صفت شناسایی شدند و مدل نهایی ارتباط-موجودیت ایجاد شد. برای تائید مدل داده‌ای نهایی از نظر ده نفر از خبرگان بانک در بخش ­های مختلف مشتریان و بانکداری عمومی، مالی و پشتیبانی، امور بانکداری الکترونیک، امور اعتباری و بانکداری شرکتی، حوزه فناوری اطلاعات  و امور بین الملل در بانک با استفاده از ابزار پرسشنامه و مصاحبه استفاده شد. همچنین با استفاده از داده­ های جمع­ آوری شده از پژوهش ­ها نمودارهای فراوانی الگوریتم ­ها، تکنیک­ ها، روش ­های نمونه ­گیری، شاخص­ های کارایی و نرم­ افزارهای داده­ کاوی مورد استفاده در پژوهش ­ها ارائه شد تا مشخص شود که به عنوان نمونه کدام الگوریتم­ های داده ­کاوی بیشترین کاربرد را در حوزه­ های مختلف داشته­ اند.     پرونده مقاله
      • دسترسی آزاد مقاله

        6 - بررسی صحت ارزیابی کارشناسان املاک با استفاده از یک مدل مبتنی بر داده‌کاوی (مطالعه موردی بانک ملت)
        فاطمه داور
        بانک‌ها به عنوان بخش اصلی نظام مالی همواره با ریسک‌های متفاوتی روبرو هستند که از عمده ترین آنها ریسک اعتبارسنجی و ارزیابی اموال است. یکی از مواردی که کارشناسان بخش ارزیابی اموال با آن مواجه هستند، نحوۀ ارزیابی و تعیین قیمت ملک بوده است. به طور کلی، کارشناسان دادگستری بر چکیده کامل
        بانک‌ها به عنوان بخش اصلی نظام مالی همواره با ریسک‌های متفاوتی روبرو هستند که از عمده ترین آنها ریسک اعتبارسنجی و ارزیابی اموال است. یکی از مواردی که کارشناسان بخش ارزیابی اموال با آن مواجه هستند، نحوۀ ارزیابی و تعیین قیمت ملک بوده است. به طور کلی، کارشناسان دادگستری بر اساس شاخص‌های قیمت گذاری، اقدام به ارزیابی املاک می‌نمایند. در این تحقیق سعی شده است تا صحت ارزیابی کارشناسان ارزیابی اموال با استفاده از مدل‌های داده‌کاوی بررسی گردد. این اقدام در جهت کمک به مدیران بانک و مسئولان ممیزی گزارشات ارزیابی، انجام گرفته است تا آنها بتوانند در مورد کارشناسان و ارزیابی‌های انجام شده توسط آنها، تصمیمات بهتری اخذ نمایند. با استفاده از شاخص‌های ارزیابی املاک و داده‌کاوی به یک مدل پیش بینی کننده جهت پیش بینی قیمت املاک دست یافته و به منظور رسیدن به یک مدل پیش بینی با عملکرد بالا، از ترکیب الگوریتم های FCM و K-NN بهره گرفته شده است که این اقدام توانست میزان دقت پیش بینی را تا حد زیادی افزایش داده و کارایی مدل پیشنهادی را بالا می برد. میزان دقت[1] در پیش بینی مبالغ ارزیابی، برابر 84.21 % و میزان خطای RMSE در پیش بینی آن برابر 0.43، بدست آمد. رویکرد پیشنهادی بر روی داده‌های ارزیابی املاک بانک ملت آزموده شد. [1] accuracy پرونده مقاله
      • دسترسی آزاد مقاله

        7 - بررسی تاثیر متغیرهای کلان اقتصادی بر رویگردانی مشتریان صنعت بانکداری ایران با رویکرد داده کاوی
        مهرناز مطهری نیا
        امروزه شناخت مشتری و درک نیازهای آن به یک ضرورت تجاری تبدیل شده‌است. سازمان‌ها برای پایداری در کسب و کارهایشان و موفقیت در بازار رقابتی نیازمند رضایت مشتریان می‌باشند. شناخت مشتریان از طریق تحلیل رفتار مشتریان با استفاده از تکنولوژی‌های جدید مانند تکنیک‌های داده‌کاوی بر چکیده کامل
        امروزه شناخت مشتری و درک نیازهای آن به یک ضرورت تجاری تبدیل شده‌است. سازمان‌ها برای پایداری در کسب و کارهایشان و موفقیت در بازار رقابتی نیازمند رضایت مشتریان می‌باشند. شناخت مشتریان از طریق تحلیل رفتار مشتریان با استفاده از تکنولوژی‌های جدید مانند تکنیک‌های داده‌کاوی برای سازمان‌ها امکان‌پذیر است. هدف از این پژوهش بررسی بررسی تاثیر متغیرهای کلان اقتصادی بر رویگردانی مشتریان صنعت بانکداری می‌باشد. به این منظور داده‌های تراکنش‌های پایانه‌های فروش کلیه بانک‌های ایران از یک شرکت ارائه‌دهنده خدمات پرداخت(PSP) مورد تحلیل قرار گرفته‌است. در مدل ارائه شده با استفاده از روش WRFM و ترکیب آن با الگوریتم خوشه بندی K-Means پایانه‌های فروش در هر ماه از نظر رویگردانی و وفاداری بخش‌بندی شده‌اند سپس با استفاده از روش‌ انتخاب ویژگی افزودن L، حذف  R و الگوریتم رگرسیون خطی چند متغیره ویژگی‌های موثر بر درصد مشتریان رویگردان از بین شاخص‌های اقتصادی ماهانه منتشر شده از بانک مرکزی ایران، در هر ماه انتخاب شده‌اند. براساس نتایج حاصل از اجرای مدل سه متغیر شاخص ارزش سهام بورس، تورم و متوسط قیمت فروش سکه تمام بهارآزادی موثرترین متغیرها از بین شاخص‌های اقتصادی مورد بررسی هستند.امروزه شناخت مشتری و درک نیازهای آن به یک ضرورت تجاری تبدیل شده‌است. سازمان‌ها برای پایداری در کسب و کارهایشان و موفقیت در بازار رقابتی نیازمند رضایت مشتریان می‌باشند. شناخت مشتریان از طریق تحلیل رفتار مشتریان با استفاده از تکنولوژی‌های جدید مانند تکنیک‌های داده‌کاوی برای سازمان‌ها امکان‌پذیر است. هدف از این پژوهش بررسی بررسی تاثیر متغیرهای کلان اقتصادی بر رویگردانی مشتریان صنعت بانکداری می‌باشد. به این منظور داده‌های تراکنش‌های پایانه‌های فروش کلیه بانک‌های ایران از یک شرکت ارائه‌دهنده خدمات پرداخت(PSP) مورد تحلیل قرار گرفته‌است. در مدل ارائه شده با استفاده از روش WRFM و ترکیب آن با الگوریتم خوشه بندی K-Means پایانه‌های فروش در هر ماه از نظر رویگردانی و وفاداری بخش‌بندی شده‌اند سپس با استفاده از روش‌ انتخاب ویژگی افزودن L، حذف  R و الگوریتم رگرسیون خطی چند متغیره ویژگی‌های موثر بر درصد مشتریان رویگردان از بین شاخص‌های اقتصادی ماهانه منتشر شده از بانک مرکزی ایران، در هر ماه انتخاب شده‌اند. براساس نتایج حاصل از اجرای مدل سه متغیر شاخص ارزش سهام بورس، تورم و متوسط قیمت فروش سکه تمام بهارآزادی موثرترین متغیرها از بین شاخص‌های اقتصادی مورد بررسی هستند. پرونده مقاله