یادگیری ماشین یک زیرشاخه از هوش مصنوعی است که الگوریتمهای پشت برنامههای کامپیوتری را که قادر به یادگیری خودکار از تجربه هستند، مطالعه میکند. مدلهای یادگیری ماشین منطق خود را بر اساس دادههای مثالی که دریافت میکنند، میسازند و به الگوریتمها متکی هستند تا پیشبینیهای خود را بر اساس عملکرد فعلیشان بهبود بخشند.
در نتیجه، آنها میتوانند بدون نیاز به دستورالعملهای برنامهریزیشده، یاد بگیرند و عمل کنند.
یادگیری ماشین: چه نوع یادگیری را به کار میگیرد؟
روشهای مختلفی از یادگیری در یادگیری ماشین رایج هستند. الگوریتمهای آموزشی برای مدلها در یکی از دستههای زیر قرار میگیرند:
– یادگیری نظارتشده (Supervised Learning)
– یادگیری بدون نظارت (Unsupervised Learning)
– یادگیری تقویتی (Reinforcement Learning)
– یادگیری نیمهنظارتی (Semi-Supervised Learning)
برای توضیح هر دسته، بهتر است از یک مثال استفاده کنیم. بیایید تجربه یک کودک خردسال را که برای اولین بار دنیای خود را کشف میکند، در نظر بگیریم. فرآیند یادگیری یک کودک مشابه یادگیری یک ماشین است. فرض کنید میخواهیم به کودک تفاوت بین یک پرتقال و یک سیب را بیاموزیم. در یادگیری نظارتشده، ورودیها و خروجیها به وضوح تعریف شدهاند و یک ناظر دادهها و اطلاعات (برچسبها) را به یادگیرنده ارائه میدهد.
بنابراین، ما هر میوه را به کودک نشان میدهیم و نام آن را تکرار میکنیم. برخلاف یادگیری نظارتشده که از دادههای خاص استفاده میکند، یادگیری بدون نظارت نیازی به برچسبها ندارد و یادگیرنده باید یک الگوی خاص در دادهها پیدا کند تا دستهها را بیاموزد.
http://65.21.55.9:82/blog/%d8%a8%db%8c%d9%86%d8%a7%db%8c%db%8c-%d9%85%d8%a7%d8%b4%db%8c%d9%86-%da%86%db%8c%d8%b3%d8%aa%d8%9f/
بنابراین در یک مثال یادگیری بدون نظارت، ما تعدادی سیب و پرتقال را جلوی کودک قرار میدهیم بدون اینکه او از قبل تفاوت آنها را بداند و از او میخواهیم آنها را به دو دسته جداگانه مرتب کند و فرآیند او را نظارت میکنیم. یادگیری تقویتی بر اساس پاداش و تنبیه است. در این روش یادگیری، زمانی که یک عمل به درستی انجام شود، مدل پاداش میگیرد و برای اقدامات نادرست با کاهش امتیاز مجازات میشود و مدل سعی میکند امتیازات خود را افزایش دهد که نشاندهنده یادگیری صحیح مدل است.
اگر کودک به درستی میوه را شناسایی کند، باید به او پاداش داده شود و اگر به اشتباه شناسایی کند، به او هشدار داده شود. با ادامه این فرآیند، کودک در شناسایی میوهها مهارت بیشتری پیدا میکند. یادگیری نیمهنظارتی ترکیبی از روشهای یادگیری نظارتشده و بدون نظارت است.
چرا یادگیری ماشین؟
در سالهای اخیر، یادگیری ماشین توجه زیادی را به خود جلب کرده است. با وجود اینکه برخی از روشهای قدیمی متوقف شدهاند، یادگیری ماشین موفقیتهای بسیاری را در حوزههای مختلف نشان داده است. اکنون میتوانیم به راحتی بسیاری از مشکلات قدیمی و جدید حلنشده را حل کنیم. برخی از حوزههایی که یادگیری ماشین در آنها مفید بوده است، عبارتند از:
– مالی، حسابداری، امتیازدهی اعتباری و معاملات الگوریتمی
– پردازش تصویر، بینایی کامپیوتر، تشخیص چهره، تشخیص حرکت و شناسایی اشیاء
– زیستشناسی محاسباتی، تشخیص تومور سرطان، تعیین توالی DNA، کشف دارو و حتی پروندههای دارویی
– تولید انرژی، پیشبینی قیمت بازار
– تولید خودرو، هوافضا
– پردازش زبان طبیعی، برنامههای تشخیص صدا و زبان
فرآیندهای یادگیری ماشین
۱– جمعآوری دادهها
اولین گام در ساخت یک مدل یادگیری ماشین، جمعآوری دادهها برای آموزش است. برای داشتن مدلی که بتواند بهخوبی همه مشکلات آینده را بیاموزد، دادههای آموزشی انتخابی باید نمایندهای از همه ترکیبات ممکن نتایج باشند. در یادگیری ماشین، معمولاً مجموعه دادهها به سه بخش تقسیم میشوند: بخش اصلی برای یادگیری، و مجموعههای داده اعتبارسنجی و آزمایش برای ارزیابی مدل استفاده میشوند.
۲– انتخاب مدل
مرحله دوم انتخاب و آموزش یک مدل است. الگوریتمها و مدلهای یادگیری ماشین مختلفی قبلاً توسعه یافته و برای بهبودها اصلاح شدهاند. بسته به نیازهای مشکل ما، میتوانیم یک مدل را انتخاب و آموزش دهیم.
۳– ارزیابی مدل
مدلهای یادگیری ماشین در طول آموزش الگوها و ویژگیهای مختلف دادههای ارائهشده را میآموزند. مدلها میتوانند وظایف مختلفی مانند طبقهبندی و تحلیل رگرسیون را یاد بگیرند. پس از آموزش یک مدل، باید آن را با استفاده از مجموعه دادههای آزمایشی و اعتبارسنجی ارزیابی کنیم تا مطمئن شویم که الگوهای صحیح را در دادهها پیدا کرده است.
۴– تنظیم ابرپارامترها
ابرپارامترها، پارامترهایی هستند که مدل نمیتواند بهتنهایی تخمین بزند و باید توسط کاربر قبل از اجرای الگوریتم مشخص شوند. این پارامترها برای فرآیند یادگیری بسیار مهم هستند، بنابراین انتخاب مقدار مناسب به بهبود یادگیری مدل کمک میکند.