یادگیری ماشین چیست ؟ امروزه عبارت “یادگیری ماشین (machine learning) ” همه جا دیده میشود: در انواع سیستمهای تشخیصدهنده تا سیستمهای هوشمند که قادر به یادگیری هستند. در این پست به این سوال میپردازیم که یادگیری ماشین چیست و خواهیم دید که اگرچه از دید اولیه هوش مصنوعی بسیار دور بوده ست، اما یادگیری ماشین ما را به هدف نهایی یعنی ایجاد ماشینهای تفکر نزدیک کرده است.
در دسامبر سال۲۰۱۷، آزمایشگاه تحقیقاتی خریداری شده توسط گوگل در سال ۲۰۱۴ به نام DeepMind، یک برنامه هوش مصنوعی (Artificial Intelligence) به نام AlphaZero معرفی کرد که میتوانست قهرمانان جهان را در چند بازی تختهای (مانند نرد و شطرنج) شکست دهد.
جالب اینجاست که AlphaZero در مورد نحوه انجام بازیها هیچ دستورالعملی از انسانها دریافت نکرده بود (به خاطر همین AlphaZero نامیده شد). در عوض، از یادگیری ماشین که شاخهای از هوش مصنوعی است و به جای دستورات صریح، رفتار خود را از طریق تجربه توسعه میدهد، استفاده میکرد.
در عرض ۲۴ ساعت، AlphaZero به عملکردی فوق بشری در شطرنج دست یافت و برنامه قبلی قهرمان جهان شطرنج را شکست داد. اندکی پس از آن، الگوریتم یادگیری ماشین AlphaZero همچنین به Shogi (بازی شطرنج ژاپنی) و بازی تختهای چینی Go مسلط شد و ورژن AlphaGo قبلی خود را با نتیجه ۱۰۰ بر صفر شکست داد.
یادگیری ماشین در سالهای اخیر بسیار رایج شده است و به رایانه کمک میکند تا مشکلاتی که قبلاً در حوزه انحصاری هوش انسان بود را حل کند. اگرچه هنوز فاصله زیادی با چشمانداز اصلی هوش مصنوعی دارد، اما یادگیری ماشین ما را به هدف نهایی یعنی ایجاد ماشینهای تفکر نزدیکتر کرده است.
تفاوتهای بین هوش مصنوعی و یادگیری ماشین چیست؟
رویکردهای سنتی برای توسعه هوش مصنوعی شامل کدگذاری دقیق تمام قوانین و دانش است که رفتار یک عامل هوش مصنوعی را تعریف میکند. هنگام ایجاد هوش مصنوعی قاعدهمحور (rule-based AI)، توسعهدهندگان باید دستورالعملهایی بنویسند که نحوه رفتار عامل هوش مصنوعی را در پاسخ به هر شرایط ممکنی مشخص کند. این رویکرد قاعدهمحور، که به عنوان هوش مصنوعی قدیمی خوب (GOFAI: good old-fashioned AI) یا هوش مصنوعی نمادین (symbolic AI) نیز شناخته میشود، سعی در تقلید از عملکردهای بازنمایی استدلال و دانش ذهن انسان دارد.
به عنوان یک مثال عالی از هوش مصنوعی نمادین میتوان به ماشین شطرنج متنباز به نام Stockfish اشاره کرد که بیش از ۱۰ سال از ساخت آن میگذرد. صدها برنامهنویس و شطرنجباز در طراحی Stockfish مشارکت داشته و با کدگذاری قوانین آن به توسعه منطقش کمک کردهاند – به عنوان مثال، هنگامی که حریف مهره اسب را از موقعیت B1 به C3 حرکت میدهد این ماشین شطرنجباز چه کاری باید انجام دهد.
اما هوش مصنوعی قاعدهمحور اغلب هنگام برخورد با موقعیتهایی که قوانین بیش از حد پیچیده و ضمنی هستند، در هم میشکند. به عنوان مثال، شناخت گفتار و تشخیص اشیا در تصاویر، عملیات پیشرفتهای هستند که نمیتوانند توسط قوانین منطقی بیان شوند.
برخلاف AI نمادین، مدلهای AI یادگیری ماشین نه با نوشتن قوانین بلکه با جمعآوری مثالها و دادهها توسعه مییابند. به عنوان مثال، برای ایجاد یک ماشین شطرنج مبتنی بر یادگیری ماشین، توسعهدهنده ابتدا یک الگوریتم پایه ایجاد میکند و سپس آن را با دادههای هزاران بازی شطرنج که از بازیهای قبلی شطرنجبازان بدست آمده است، “آموزش میدهد” . با تجزیه و تحلیل دادهها، هوش مصنوعی الگوهای متداولی که به استراتژیهای پیروزی منجر میشود را پیدا میکند، و میتواند از آنها برای شکست دادن حریفان واقعی استفاده کند.
هرچه هوش مصنوعی به تعداد بیشتری از دادههای بازیها دسترسی داشته باشد و آنها را مرور کند، در پیشبینی حرکات منجر به برنده شدن، بهتر میشود. به همین دلیل است که یادگیری ماشین به عنوان برنامهای تعریف میشود که عملکرد آن با تجربه بهبود مییابد.
کابردهای یادگیری ماشین چیست؟ این فناوری برای بسیاری از کارهای واقعی از جمله طبقهبندی تصاویر، تشخیص صدا، پیشنهاد و توصیه انواع محتوا، تشخیص تقلب و پردازش زبان طبیعی قابل اجرا است.
یادگیری با نظارت و بدون نظارت (Supervised and Unsupervised Learning)
توسعهدهندگان این حوزه بسته به مشکلی که میخواهند حل کنند، دادههای مربوطه را برای ساختن مدل یادگیری ماشین خود آماده میکنند. به عنوان مثال، اگر آنها بخواهند برای یادگیری معاملات بانکی متقلبانه از یادگیری ماشین استفاده کنند، ابتدا لیستی از معاملات موجود را تهیه میکنند و نتیجه آنها را (در اینجا نتایج میتوانند دو حالت جعلی یا معتبر داشته باشند) برچسبگذاری میکنند. هنگامی که این دادهها را به الگوریتم تغذیه میکنند، مدل، معاملات جعلی و معتبر را از هم جدا میکند و ویژگیهای مشترک دادهها در هر طبقه را پیدا میکند. فرآیند آموزش مدلهای یادگیری ماشین با دادههای برچسب خورده، “یادگیری تحت نظارت یا یادگیری با سرپرستی” نامیده میشود و در حال حاضر این نوع یادگیری، شکل غالب مدلهای یادگیری ماشین است.
منابع آنلاین بسیاری برای دادههای آمادهی دارای برچسب مربوط به کارهای مختلف وجود دارند. برخی از نمونههای معروف پایگاه داده ImageNet (که یک مجموعه داده متنباز با بیش از ۱۴ میلیون تصویر دارای برچسب است) و MNIST (که مجموعه دادهای با ۶۰ هزار عدد دست نویس دارای برچسب است) هستند. توسعهدهندگان یادگیری ماشین همچنین از پلتفرمهایی مانند Mechanical Turk آمازون، که یک مرکز استخدام آنلاین و درخواستی است، برای انجام کارهای شناختی مانند برچسبگذاری نمونههای تصویری و صوتی استفاده میکنند. یک بخش در حال رشد استارتآپها نیز در حاشیهنویسی و برچسبگذاری دادهها تخصص دارند.
اما همه مسائل نیازی به دادههای دارای برچسب ندارند. برخی از مسائل یادگیری ماشین را میتوان از طریق “یادگیری بدون نظارت یا یادگیری بدون سرپرستی” حل کرد، جایی که شما دادههای خام و بدون برچسب را به مدل AI میدهید و اجازه میدهید تا خودش یاد بگیرد و تشخیص دهد که کدام دادهها و الگوها به هم مربوط هستند.
یک استفاده معمول از یادگیری بدون نظارت، تشخیص ناهنجاری است. به عنوان مثال، الگوریتم یادگیری ماشین میتواند دادههای خام ترافیک شبکه یک دستگاه متصل به اینترنت – به عنوان مثال یخچال هوشمند- را یاد بگیرد. پس از آموزش، هوش مصنوعی یک خط پایه برای دستگاه ایجاد میکند و میتواند اتفاقات پرت و ناهنجار را تشخیص و نشان دهد. بنابراین اگر دستگاه به بدافزار آلوده شود و ارتباط خود را با سرورهای مخرب آغاز کند، مدل یادگیری ماشین قادر به شناسایی آن خواهد بود، زیرا ترافیک شبکه در این حالت با رفتار عادی مشاهده شده در طول آموزش متفاوت است.
یادگیری تقویتی (reinforcement learning)
تاکنون، احتمالاً میدانید که دادههای با کیفیت آموزشی نقش بسزایی در کارایی مدلهای یادگیری ماشین دارند. اما یادگیری تقویتی نوع خاصی از یادگیری ماشین است که در آن هوش مصنوعی بدون استفاده از دادههای قبلی رفتار خود را توسعه میدهد.
مدل های یادگیری تقویتی بدون هیچ پیشزمینهای شروع میکنند. به آنها فقط دستوراتی درمورد قوانین اساسی محیط و وظیفهای که پیش رو دارند، داده میشود. آنها از طریق آزمون و خطا میآموزند که اقدامات خود را برای اهداف مورد نظر خود بهینه کنند.
ماشین AlphaZero آزمایشگاه DeepMind یک مثال جالب از یادگیری تقویتی است. برخلاف دیگر مدلهای یادگیری ماشین، که باید ببینند انسانها چگونه شطرنج بازی میکنند و از آنها میآموزند، AlphaZero فقط با دانستن حرکات مهرهها و شرایط برد، بازی را شروع کرد. پس از آن، میلیونها بار با خودش مسابقه داد، که با اقدامات تصادفی شروع میشد و به تدریج الگوهای رفتاری خود را توسعه میداد.
یادگیری تقویتی یک حوزه جذاب تحقیقاتی است. این زمینه، فناوری اصلی در تولید مدلهای هوش مصنوعی بوده است که توانسته است به بازیهای پیچیدهای مانند Dota 2 و StarCraft 2 تسلط پیدا کند و همچنین برای حل مشکلات زندگی واقعی مانند مدیریت منابع مرکز داده و ساخت دستهای رباتیک که میتوانند اشیا را با مهارت مشابه انسانی استفاده کنند، به کار برده شدهاند.
یادگیری عمیق (Deep learning)
یادگیری عمیق یکی دیگر از زیرمجموعههای محبوب یادگیری ماشین است. این مدلها از شبکههای عصبی مصنوعی (artificial neural networks)، که ساختارهای نرمافزاری تقریباً الهام گرفته از ساختار بیولوژیکی مغز انسان هستند، استفاده میکنند.
شبکه های عصبی در پردازش داده های غیرساختارمند مانند تصاویر، فیلم، صوت و گزیدههای طولانی متون از قبیل مقالات و نوشتههای علمی پژوهشی، بسیار سرآمد هستند. قبل از یادگیری عمیق، کارشناسان یادگیری ماشین مجبور بودند تلاش زیادی برای استخراج ویژگی ها از تصاویر و فیلمها انجام دهند و علاوه بر آن الگوریتمهای خود را نیز اجرا کنند. شبکههای عصبی بدون نیاز به تلاش زیاد مهندسان، این ویژگیها را به طور خودکار استخراج میکنند.
یادگیری عمیق پشت بسیاری از فناوریهای مدرن هوش مصنوعی مانند اتومبیلهای بدون راننده، سیستمهای پیشرفته ترجمه و فناوری تشخیص چهره در iPhone X شماست.
محدودیتهای یادگیری ماشین چیست؟
مردم اغلب یادگیری ماشین را با هوش مصنوعی همسطح انسان اشتباه میگیرند و بخشهای بازاریابی برخی از شرکتها عمداً از این اصطلاحات به جای یکدیگر استفاده میکنند. اگرچه یادگیری ماشین گامهای بلندی در جهت حل مشکلات پیچیده برداشته است، اما هنوز از ایجاد ماشینهای تفکر که پیشگامان هوش مصنوعی تصور میکنند، بسیار فاصله دارد.
هوش واقعی علاوه بر یادگیری از تجربه، مستلزم استدلال، درک عام و تفکر انتزاعی است – مسائلی که مدلهای یادگیری ماشین در آنها بسیار ضعیف عمل میکنند.
به عنوان مثال، در حالیکه یادگیری ماشین در انجام وظایف پیچیدهی تشخیص الگو مانند پیشبینی سرطان سینه قبل از رخ دادن آن مهارت دارد، اما هنوز هم با وظایف سادهتر منطق و استدلال مانند حل مسائل ریاضی دبیرستان دست و پنجه نرم میکند.
محدودیتهای دیگر یادگیری ماشین چیست؟ عدم قدرت استدلال یادگیری ماشین باعث میشود که در تعمیم دانش خود بد عمل کند. به عنوان مثال، یک عامل یادگیری ماشین که میتواند Super Mario 3 را مانند یک فرد حرفهای بازی کند، بر یک بازی پلتفرم دیگر مانند Mega Man یا حتی نسخه دیگری از Super Mario تسلط نخواهد داشت و باید از ابتدا آموزش داده شود.
بدون قدرت استخراج دانش مفهومی از تجربه، مدلهای یادگیری ماشین برای انجام هرکاری به هزاران داده برای آموزش نیاز دارند. متأسفانه، بسیاری از زمینهها فاقد دادههای آموزشی کافی هستند یا بودجه لازم برای فراهم آوردن این دادهها را ندارند. یادگیری عمیق، که اکنون شکل رایج یادگیری ماشین است، نیز از یک مسئله رنج میبرد: شبکههای عصبی به روشهای پیچیدهای کار میکنند و منطق تصمیمگیری آنها روشن نیست. این شبکهها به صورت جعبه سیاه در نظر گرفته میشوند و حتی سازندگان این سیستمها نیز برای جستوجو و فهم فرایندهای تصمیمگیری آنها به شدت تلاش میکنند. این امر استفاده از قدرت شبکههای عصبی را در موقعیتهایی که نیاز قانونی برای توضیح تصمیمات هوش مصنوعی وجود دارد، دشوار میکند.
خوشبختانه تلاشهایی برای غلبه بر محدودیتهای یادگیری ماشین انجام شده است. یک نمونه قابلتوجه نوآوری گسترده دارپا (DARPA) یا آژانس پروژههای پژوهشی پیشرفته دفاعی (Defense Advanced Research Projects Agency)، بخش تحقیقاتی وزارت دفاع، برای ایجاد مدلهای AI قابل توصیف (Explainable) است . در مدلهای قابل توصیف اقدامات در هر مرحله توسط انسان قابل درک هستند به طوری که میتوان علت تعریف هر تصمیم را توضیح داد.
پروژه های دیگر با هدف کاهش وابستگی بیش از حد یادگیری ماشین به دادههای حاشیهنویسی شده و در دسترس قرار دادن این فناوری برای زمینههایی با دادههای آموزشی محدود در حال انجام است. محققان IBM و MIT اخیراً با ترکیب هوش مصنوعی نمادین با شبکههای عصبی در این زمینه ورود پیدا کردهاند. مدلهای ترکیبی هوش مصنوعی برای آموزش به دادههای کمتری نیاز دارند و میتوانند برای تصمیمات خود توضیحات گام به گام ارائه دهند.
اینکه آیا تکامل یادگیری ماشین در نهایت به ما کمک میکند تا به هدف گریزجویانه ایجاد هوش مصنوعی در سطح انسان برسیم، باید منتظر ماند. اما آنچه به طور قطع میدانیم این است که به لطف پیشرفت در یادگیری ماشین هر روز دستگاههایی که روی میزهایمان نشسته یا در جیبهایمان استراحت میکنند، هوشمندتر میشوند.
ترجمه اختصاصی توسط مجله قرمز
منبع : pcmag