یادگیری ماشین چیست؟
یادگیری ماشین چیست؟
امروزه با پیشرفت تکنولوژی شاهد نفوذ تصمیمگیری ماشینها در امور روزمره زندگی خود هستیم. تصمیماتی که تا چند سال پیش انجام آنها بدون ذهن انسان قابل تصور نبود. در این نوع فرایندها، مجموعه ای از عوامل به خصوص فناوری یادگیری ماشین، به کامپیوترها کمک میکند تا بتوانند مسائلی که تاکنون فقط توسط انسان ها قابل انجام بوده، حل کرده و به نتیجه برسانند.
گفتنی است یادگیری ماشین "Machine Learning" به عنوان یکی از بخشهای بسیار مهم و پر کاربرد هوش مصنوعی تحولی عظیم در درک حس غیر قابل پیش بینی جهان واقعی برای نرم افزارها به وجود آورده است. از این رو میتوان یادگیری ماشین را، فرآیند آموزش سیستمهای کامپیوتری برای خلق پیش بینیهای درست بر اساس دادههای دریافتی تعریف کرد.
فرایند مذکور یا همان الگوریتمهای یادگیری ماشین میتوانند پیش بینیهای سادهای همچون تشخیص نوع میوه در یک تصویر، تشخیص معنای درست کلمه book در یک جمله ( به معنای کتاب و یا رزرو هتل) و یا حتی تشخیص کلمات یک ویدیو در یوتیوب، جهت ساخت کپشن برای آن را داشته باشند و در تمامی این موارد برخلاف نرمافزارهای سنتی، توسعه دهنده برنامه هیچ گونه دستورالعملی برای اجرای دستورات تشخیصی ننوشته است، در عوض یک سیستم یادگیری ماشین با دریافت انبوهی از دادهها آموزش دیده است که چگونه بتواند به طور صحیح و قابل اعتماد تشخیص درستی داشته باشد.
در اصل حجم عظیم داده ها، کلید آموزش یک ماشین است.
تفاوت یادگیری ماشین و هوش مصنوعی
با وجود اینکه یادگیری ماشین یا ML عامل موفقیتهای بسیار زیادی در حوزه فناوری اطلاعات در سالهای اخیر بوده است، اما باید توجه داشت یادگیری ماشین تنها یکی از متدهای دستیابی به هوش مصنوعی به شمار میآید.
سال 1950 هنگام تولد هوش مصنوعی، این فناوری به عنوان توانایی ماشین در اجرای عملی که نیازمند هوش انسانی است تعریف شد، اما در حال حاضر سیستمهای هوش مصنوعی به طور کلی باید نمایانگر اکثر ویژگیهایی چون توانایی برنامهریزی، یادگیری، حل مسئله، ارائه دانش، استدلال کردن، ایجاد تغییر، حرکت، هوش اجتماعی و خلاقیت باشند.
به علاوه موارد ذکر شده، برای ساخت سیستمهای هوش مصنوعی، در کنار یادگیری ماشین، روشهای مختلف زیادی مانند محاسبات تکمیلی (در قسمت هایی که الگوریتمها تحت جهشهای تصادفی و ترکیب بین نسلها در تلاش برای تکمیل راه حلهای بهینه هستند)، سیستمهای خبره "Expert Systems" (در قسمتهایی که کامپیوترها با قوانینی برنامهریزی شدهاند که به آنها اجازه تقلید رفتار یک انسان متخصص را در یک حوزه خاص میدهد مانند سیستم خلبان خودکار) نیاز است.
انواع مختلف یادگیری ماشین
یادگیری ماشین به طورکلی به دو دسته اصلی نظارت شده "Supervised" و نظارت نشده تقسیم میشود .البته لازم به ذکر است در کنار این دو دسته اصلی، دو دسته نیمه نظارت شده و تقویت شده نیز تعریف شده است. با ایستا همراه باشید تا با این دسته بندیها بیشتر آشنا شوید:
یادگیری ماشین نظارت شده
در یادگیری نظارت شده، ماشینها با استفاده از نمونهها آموزش میبینند. در واقع سیستمها در یادگیری نظارت شده از انبوهی از دادههای برچسب گذاری شده استفاده میکنند. برای مثال تصاویری از ارقام نوشته شده به گونه ای تفسیر میشوند که هر کدام مرتبط با چه عددی هستند. با دادن نمونههای کافی به یک سیستم یادگیری نظارت شده، این سیستم میتواند خوشههایی از پیکسلها و اشکال مرتبط با هر عدد را تشخیص دهد و در انتها عدد نوشته شده را شناسایی و بین اعداد 9، 4،6 و 8 تفاوت قایل میشود.
در این نوع یادگیری معمولاً برای آموزش ماشین، نیاز به حجم عظیمی از اطلاعات برچسب گذاری شده جهت ارائه به سیستم است که این امر باعث به وجود آمدن دیتاستهای عظیمی خواهد شد. به عنوان مثال دیتاستopen image گوگل با بیش از 9 میلیون تصویر و یا YouTube-8M ،دیتاستی از 8 میلیون ویدیو (500هزار دقیقه) و یا ImageNet نمونه هایی از این نوع دیتاستهای عظیم هستند. گفتنی است روز به روز اندازه دیتاستهای آموزشی در حال افزایش است. در همین راستا فیس بوک اخیراً اعلام کرده است بیش از 3.5 میلیارد تصویر در دسترس اینستاگرام را کامپایل و از هشتگهای پیوست هر عکس به عنوان برچسب استفاده کرده است. این شرکت با استفاده از یک میلیارد از این عکسها توانسته است رکورد سطح درستی 85.4 را به دست آورد.
گفتنی است فرایند دشوار برچسب گذاری این دیتاستهای عظیم معمولاً با استفاده از سرویسهایی مانندAmazon Mechanical Turk که دسترسی به نیروی کار با دستمزد پایین را دارند، صورت میگیرد. با این حال روش اتخاذی از سوی شرکت فیس بوک و استفاده از دادههای در دسترس برای آموزش سیستم میتواند، راه جایگزین مناسبی برای جلوگیری از برچسب گذاری دستی باشد.
یادگیری ماشین نظارت نشده
در یادگیری ماشین نظارت نشده، الگوریتمها بدون دریافت هیچگونه داده برچسبگذاری شده و تنها با شناسایی الگوها در میان دادههای دریافتی سعی میکنند شباهت میان آنها را کشف کرده و دادهها را دسته بندی کنند. مانند Google News که بر اساس مشابهت موضوعی هر روز داستانها را دسته بندی میکند.
در این نوع یادگیری الگوریتمها به هیچ عنوان برای دسته بندی داده ها طراحی نشده و آنها را بر اساس مشابهتها در یک گروه قرار میدهند.
یادگیری ماشین نیمه نظارت شده
روش نیمه نظارت شده، همانطور که از اسمش پیداست، ترکیبی از دو روش فوق است. در این روش از حجم کمی از دادههای برچسب گذاری شده و حجم عظیمی از دادههای برچسب گذاری نشده استفاده میشود. در واقع اهمیت روش نظارت شده به دلیل بالا بودن حجم دادههای که باید برچسب گذاری شوند رو به کاهش است. در روش نیمه نظارت شده از آن دسته کمی از دادههای برچسب گذاری شده برای یادگیری نسبی مدل استفاده میشود و بعد از آن مدل آموزش دیده نسبی، برای برچسب گذاری بقیه دادهها به کار گرفته خواهد شد. به این فرایند شبه برچسب گذاری گفته میشود. در نهایت مدل از نتیجه ترکیب دادههای برچسب گذاری شده و شبه برچسب گذاری آموزش خواهد دید.
گفتنی است اخیراً پایداری یادگیری نیمه نظارت شده توسط Generative Adversarial Networks (GANs) تقویت شده است. این نوع سیستمها، از دادههای برچسب گذاری شده، دادههای کاملاً جدید تولید میکنند.
یادگیری ماشین تقویت شده
برای دریافت بهتر مفهوم یادگیری ماشین تقویت شده میتوان از یک مثال استفاده کرد. فرض کنید چگونه شخصی ممکن است بدون آشنایی با قوانین و نحوه یک بازی کامپیوتری، بازی با آن را یاد بگیرد. با وجود اینکه این فرد میتواند کاملاً یک تازه کار باشد، اما در نهایت با نگاه کردن به ارتباط بین دکمههای بازی و فشردن آنها و نیز اتفاقی که در صفحه میافتد، به تدریج عملکرد خود را بهتر و بهتر خواهد کرد.
بهترین نمونه مشهور این نوع یادگیریGoogle DeepMind است که بر روی آموزش و ارتقا سامانههای کامپیوتری با توانایی بازی، تمرکز دارد. در واقع یک سیستم، پیکسلهایی را از هر بازی دریافت کرده و از این طریق اطلاعات گوناگونی درمورد بازی، مانند فاصله بین اهداف روی صفحه مشخص میکند. بعد از گذراندن این مراحل این سیستم میتواند، چگونگی وضعیت یک بازی و اجرای عملیاتی که مرتبط با دریافت امتیاز بیشتر است را بعد از چندین بار بازی کردن، آموزش ببیند.
یادگیری ماشین درچه مواردی کاربرد دارد؟
سیستمهای یادگیری ماشین امروزه کاربردهای فراوانی در دنیای مدرن اینترنتی دارند. این سیستمها میتوانند به شما پیشنهاد دهد و یا پیشبینی کند خرید بعدی شما از آمازون چیست و یا ویدیوی بعدی که ممکن است در سایت نت فیلیکس مشاهده کنید، کدام است. در هر جستجوی شما در گوگل از چندین سیستم یادگیری ماشین برای فهمیدن زبان درخواست شما جهت شخصی سازی نتیجه مورد نظرتان استفاده میشود. همچنین سیستم های شناسایی فیشینگ با استفاده از مدلهای آموزش دیده یادگیری ماشین، صندوق پیام شما را از اسپم ها دور نگه میدارد.
چند مورد دیگر از نمونههای مشهور و قدرتمند یادگیری ماشین را میتوان در دستیارهای مجازی مانند سیری، الکسا، کوارتانا و دستیار گوگل مشاهده کرد که یادگیری ماشین را برای پشتیبانی تشخیص صدا و توانایی فهمیدن زبان طبیعی استفاده میکنند.
همچنین باید گفت در صنایع مختلف دیگری چون، بینایی کامپیوتری برای ماشینهای بدون راننده، پهبادها، رباتهای تحویل دهنده، تشخیص زبان برای رباتهای خدماتی، تشخیص چهره برای امور نظارتی در کشورهایی مانند چین، کمک به رادیولوژیستها در بخشی از فرایند درمان، کمک به محققان ژنتیک برای ارائه داروهای مفیدتر در درمان بیماران و........ یادگیری ماشین کاربردهای موثر و زیادی دارد.
منابع:
- وب گاه zdnet
- وب گاه ai.googleblog
- وب گاه image-net
- وب گاه code.facebook
- وب گاه towardsdatascience