ساخت مدل شبکه عصبی عمیق با الهام از الگوریتم جنگل تصادفی برای آنالیز داده های بیان ژن
10 تیر 1401
ارسال شده توسط علیرضا دوست محمدی

مدل شبکه عصبی از جمله مدل های پرکاربرد در یادگیری ماشین است اما بر خلاف کاربرد گسترده اش استفاده از این مدل برای دسته بندی داده های بیان ژن با مشکل جدی مواجه است.
در داده های بیان ژن تعداد ویژگی ها (p) نسبت به تعداد نمونه ها (n) بسیار بیشتر است و این ویژگی با مدل شبکه عصبی عمیق همراستا نیست و نمی توان از آن برای دسته بندی داده های بیان ژن استفاده کرد.
عدم وجود ارتباط معنادار میان ویژگی ها موجب می شود نتوانیم در مرحله پیش پردازش داده ها، ویژگی ها را کاهش دهیم. برای حل این مشکل نویسندگان این مقاله ترکیب الگوریتم جنگل تصادفی (random forest) نظارت شده و شبکه عصبی عمیق یا به اختصار (FDNN) را پیشنهاد داده اند.
در الگوریتم جنگل تصادفی که مبتنی بر یادگیری دسته جمعی (Ensemble Learning) است با توجه به آنکه تعداد نمونه ها زیاد نیست ابتدا نمونه ها تکرار می شوند و جهت ساخت مدل بخشی از نمونه ها و تعدادی از ویژگی ها استفاده می شود. استفاده از چنین روشی در مدل شبکه عصبی عمیق موجب کاهش احتمال حساس شدن مدل به نمونه های یادگیری می شود و قدرت مدل را افزایش می دهد.
جهت ارزیابی ظرفیت این مدل ترکیبی از شبیه سازی های آزمایشگاهی و آنالیز داده های واقعی دو مجموعه داده RNA استفاده شده است.
این مدل نسبت به مدل جنگل تصادفی و شبکه عصبی عمیق از عملکرد بهتری برخوردار است و معنادار تر به انتخاب ویژگی ها می پردازد.
لینک مقاله:

درباره علیرضا دوست محمدی
فارغ التحصیل کارشناسی ارشد رشته بیوانفورماتیک از دانشگاه تربیت مدرس
نوشتههای بیشتر از علیرضا دوست محمدی
دیدگاهتان را بنویسید
برای نوشتن دیدگاه باید وارد بشوید.