عنوان فارسی |
فاصله متغیر استاندارد شده: یک روش یادگیری ماشین مبتنی بر فاصله |
عنوان انگلیسی |
Standardized Variable Distances: A distance-based machine learning method |
کلمات کلیدی |
یادگیری ماشین؛ طبقه بندی کننده چند کلاسه؛ طبقه بندی کننده مبتنی بر فاصله |
درسهای مرتبط |
مهندسی کامپیوتر |
تعداد صفحات انگلیسی : 14 | نشریه : ELSEVIER |
سال انتشار : 2020 | تعداد رفرنس مقاله : 27 |
فرمت مقاله انگلیسی : PDF | نوع مقاله : ISI |
آیا این مقاله برای بیس پایان نامه مناسب است؟ : بله | آیا این مقاله برای ارائه کلاسی مناسب است؟ : بله |
برنامه ای که در آن مقاله شبیه سازی شده است : این مقاله در محیط متلب پیاده سازی شده است | نام مجله مقاله : Applied Soft Computing Journal (مجله رایانش نرم کاربردی) |
ترجمه: ندارد | گزارشکار : ندارد | شبیه سازی : دارد (فایل های شبیه سازی در نرم افزار متلب با فرمت .m) |
این مقاله در محیط متلب به صورت کامل شبیه سازی شده و در صورت خرید و دانلود مقاله شما به راحتی قادر خواهید بود از برنامه مربوطه استفاده نمایید. در صورت بروز هر گونه مشکل در نحوه ی اجرای برنامه سایت سیگمالند به مدت 24 ساعت بعد از خرید محصول، پشتیبانی آن را تا اجرای کامل برعهده دارد.
در عصر حاضر، الگوریتمهای یادگیری ماشین حوزه تحقیقاتی مهمی محسوب می شوند، به طوریکه از قابلیت تحلیل و مدلسازی دادهها در هر زمینهای برخوردار می باشند. همچنین، اطلاعات به دست آمده از طریق روش های یادگیری ماشینی به محققان و برنامه ریزان در زمینه درک و بررسی مسائل سیستماتیک استراتژی های فعلی شان کمک شایان توجهی می کند. بنابراین، بسیار حائز اهمیت است که به طور کامل در هر زمینه ای که زندگی انسان را تسهیل می کند، نظیر تشخیص زودهنگام و صحیح، انتخاب صحیح، سیستم های مستقل کاملاً کارآمد به کار گرفته شوند. در این مقاله، یک الگوریتم جدید یادگیری ماشین برای طبقهبندی چند کلاسه ارائه شده است. این روش پیشنهادی بر اساس الگوریتم طبقهبندی کننده حداقل فاصله (MDC) طراحی شده است. همچنین، MDC حساس به واریانس نیست، زیرا بردارهای ورودی را با محاسبه فاصله/شباهتهای آنها با در نظر گرفتن کلاس مرکز ثقل (مقدار متوسط بردارهای ورودی یک کلاس) طبقهبندی میکند. یافته های بدست آمده حاکی از آن است که داده های دنیای واقعی دارای نسبت های خاصی از نویز هستند. این وضعیت دارای تأثیر منفی بر عملکرد MDC می باشد. برای رفع این مسئله، یک مدل حساس به واریانس را ارائه نموده و آنرا با توجه به عوامل انحراف معیار و امتیاز z (متغیر استاندارد شده)، فواصل متغیر استاندارد (SVD) نامگذاری می کنیم. برای اطمینان از صحت SVD، از مجموعه داده های اصلی سرطان پستان (WBCO) و دامنه نمایشگر LED ( led 7 رقمی) استفاده نمودیم که از مخزن یادگیری ماشین UCI با اعتبارسنجی متقاطع 5 برابری به دست آوردیم. همچنین، عملکرد طبقهبندی SVD با درخت تصمیم (DT)، جنگل تصادفی (RF)، k-نزدیک ترین همسایه (k-NN)، رگرسیون لجستیک چند جملهای (MLR)، الگوریتم نایو بیز ساده (NB)، ماشین بردار پشتیبان (SVM) و طبقهبندی کننده حداقل فاصله (MDC) که در مقالات شناخته شده هستند، مورد مقایسه و تحلیل قرار گرفت. همچنین در طول پنج سال گذشته، سیزده مطالعه مختلف با استفاده از مجموعه داده های مشابه مقایسه شده است. نتایج بدست آمده در زمینه مطالعات تجربی حاکی از آن است که SVD در مقایسه با روشهای سنتی و پیشرفته به نحو بهتری میتواند در این پروژه طبقهبندی شود. روش پیشنهادی به دقت طبقه بندی بالاتر از 97٪ (CACC)، اندازه گیری F (FM) و سطح زیر منحنی (AUC) در مجموعه داده WBCO دست یافت. در مجموعه داده led 7رقمی، تقریباً امتیازات 74% CACC, 75.1% FMو 82.2٪ AUC به دست آمد. همچنین، مشاهده شد که امتیازات طبقه بندی به دست آمده با SVD، در مقایسه با سایر الگوریتم های ML استفاده شده در مطالعات تجربی بالاتر است.
این مقاله مربوط به سال 2020 بوده و شبیه سازی آن با استفاده از نرم افزار متلب (MATLAB) انجام شده است.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.