یک سیستم کنترل هوشمند که پژوهشگران MIT توسعه دادهاند، به پهپادهای خودران کمک میکند تا حتی در شرایط غیرقابل پیشبینی محیطی نیز مسیر خود را حفظ کنند. تصور کنید پهپادی که برای مهار آتشسوزی در کوههای سیرا نوادا بهکار گرفته شده، ناگهان با بادهای شدید و چرخانی مانند باد سانتا آنا مواجه شود. تطبیق سریع با چنین ناهنجاریهایی، چالشی بزرگ برای سیستمهای کنترل پرواز محسوب میشود.
محققان MIT برای حل این مشکل، الگوریتم کنترلی جدیدی را مبتنی بر یادگیری ماشین طراحی کردهاند که انحراف پهپاد از مسیر تعیینشده را به حداقل میرساند، حتی اگر با نیروهای غیرمنتظرهای مانند بادهای تند روبهرو شود.
بر خلاف روشهای سنتی که نیاز به شناخت قبلی از ساختار اختلالات احتمالی دارند، این روش نوین به کمک هوش مصنوعی، تنها با استفاده از ۱۵ دقیقه دادههای پروازی، ساختار لازم را یاد میگیرد. نکته کلیدی در این تکنولوژی آن است که سیستم بهطور خودکار الگوریتم بهینهسازی مناسب برای مقابله با اختلالات را انتخاب کرده و با توجه به نوع اختلال خاص، بهترین عملکرد ممکن را ارائه میدهد.
این سیستم با روشی به نام “یادگیری فراشناختی” (meta-learning) آموزش دیده که به آن کمک میکند بتواند سریعاً به انواع مختلفی از اختلالات واکنش نشان دهد. نتیجه این ترکیب هوشمندانه، کاهش ۵۰ درصدی خطای مسیریابی نسبت به روشهای مرسوم در شبیهسازیها بوده است. به علاوه، عملکرد این سیستم حتی در مواجهه با سرعتهای بادی جدید که قبلاً دیده نشدهاند، نیز بهتر از سایر روشهاست.
در آینده، این فناوری میتواند به پهپادهای خودران کمک کند تا محمولههای سنگین را حتی در شرایط باد شدید با دقت بیشتری منتقل کرده یا مناطق مستعد حریق را مؤثرتر پایش کنند. به گفته نوید عظیزان، استادیار مهندسی مکانیک در MIT و نویسنده اصلی این تحقیق، مزیت اصلی این روش در یادگیری همزمان اجزای مختلف نهفته است، بهطوریکه سیستم بهطور خودکار تصمیماتی برای سازگاری سریع اتخاذ میکند.
در اغلب سیستمهای کنترلی مرسوم، نیاز است که مدلی از اختلالات محتمل طراحی شود. اما در جهان واقعی، پیشبینی همه این اختلالات عملاً غیرممکن است. بسیاری از این سیستمها از الگوریتم معروف “gradient descent” برای بهینهسازی استفاده میکنند، در حالی که این فقط یکی از چندین الگوریتم موجود در خانواده روشهای “mirror descent” است.
در این روش جدید، به جای طراحی دستی مدل اختلالات، یک شبکه عصبی (neural network) از دادهها یاد میگیرد که این اختلالات را تخمین بزند. همچنین، الگوریتمی استفاده میشود که بهصورت خودکار مناسبترین تابع از میان گزینههای مختلف انتخاب میکند. بدین ترتیب، دیگر نیازی نیست برنامهنویس سیستم از قبل بهترین عملکرد را انتخاب کرده باشد.
تغییر شرایط محیطی، مانند شدت باد، ضرورت بازآموزی شبکه عصبی را در هر پرواز افزایش میدهد. برای مقابله با این چالش، پژوهشگران از متا-لرنینگ استفاده کردهاند که به سیستم امکان میدهد از خانوادههای مختلفی از سرعت بادها، ساختار کلی را یاد بگیرد. این موضوع باعث افزایش انعطافپذیری و کاهش نیاز به بازآموزی در هر پرواز میشود.
در آزمایشهای شبیهسازیشده و دنیای واقعی، این روش در تمامی سرعتهای بادی آزموده شده، عملکرد بهتری نسبت به روشهای رایج داشته است. حتی در شرایطی که شدت باد بیش از حد انتظار باشد، سیستم طراحیشده همچنان به خوبی عمل میکند.
محققان اکنون در حال آزمایش سختافزاری این سیستم بر روی پهپادهای واقعی در شرایط مختلف محیطی هستند. آنها همچنین در حال بررسی امکان پاسخگویی سیستم به اختلالات چندگانه بهطور همزمان هستند، مانند تغییر جهت وزن بسته حملشده به علت تغییرات در جریان باد. هدف بعدی، گسترش قابلیت “یادگیری پیوسته” است، بهگونهای که سیستم بدون نیاز به بازتعلیم، بتواند به اختلالات جدید واکنش نشان دهد.
بابک حبیبی، استاد دانشگاه Caltech نیز این تحقیق را پیشرفتی بزرگ در ترکیب یادگیری فراشناختی با کنترل تطبیقی سنتی دانسته و معتقد است که این رویکرد میتواند در طراحی سیستمهای خودران برای محیطهای پیچیده و نامطمئن تأثیر بسزایی داشته باشد.
این پروژه با حمایت مشترک موسسات MathWorks، آزمایشگاه هوش مصنوعی MIT-IBM Watson، مرکز علمی MIT-Amazon و برنامه نوآوری محاسباتی MIT-Google انجام شده است.