در برخی ایستگاههای قطار، زمانی که قطارها به آخر خط میرسند، باید برای بازگشت به سکوی ویژهای منتقل شوند. گاهی این قطارها از سکویی که به آن وارد شدهاند، دوباره حرکت نمیکنند — بلکه از سکوی دیگری راهی مقصد میشوند.
برای برنامهریزی این حرکتها، مهندسان از نرمافزارهایی به نام حلکنندههای الگوریتمی استفاده میکنند. اما وقتی یک ایستگاه روزانه میزبان هزاران ورود و خروج قطار است، حجم دادهها و پیچیدگی وضعیت بسیار بیشتر از توان حل یک الگوریتم سنتی میشود.
اکنون پژوهشگران MIT با استفاده از یادگیری ماشین، سیستمی جدید طراحی کردهاند که زمان حل این معماهای پیچیده را تا ۵۰٪ کاهش میدهد و راهحلی ارائه میدهد که بیشتر با اهداف کاربر، مانند حرکت بهموقع قطارها، همخوانی دارد. این روش جدید همچنین میتواند برای حل چالشهای لجستیکی دیگر – مانند برنامهریزی برای کارکنان بیمارستانها، تخصیص خدمه پروازی یا تخصیص وظایف به ماشینهای کارخانه – نیز کاربرد داشته باشد.
کاهش بازپردازشهای تکراری
در مواجهه با مشکلات پیچیده، مهندسان معمولاً آن را به دنبالهای از زیرفرآیندها تقسیم میکنند. اما از آنجا که این زیرفرآیندها با هم همپوشانی دارند، بسیاری از تصمیمگیریها بارها تکرار میشود و زمان حل مسئله بالا میرود.
در روش جدید، یادگیری ماشین ابتدا بررسی میکند که کدام بخش از زیرفرآیند نیاز به محاسبه مجدد ندارد. سپس این قسمتها “فریز” شده و فقط بخشهای باقیمانده به حلکننده الگوریتمی سنتی داده میشود.
کتی وو، استادیار توسعه شغلی در مهندسی عمران و محیط زیست در MIT، در این باره میگوید: «اغلب اوقات تیمی متشکل از متخصصان باید ماهها یا حتی سالها زمان صرف طراحی الگوریتمی برای حل یکی از این مسائل ترکیبی کنند. اما یادگیری عمیق مدرن این امکان را به ما میدهد تا با کمک هوش مصنوعی، روند طراحی این الگوریتمها را تسهیل و تسریع کنیم.»
این پژوهش به رهبری سیروی لی (دانشجوی تحصیلات تکمیلی در IDSS) و با همکاری ونبین اویانگ، یینینگ ما و خود کتی وو انجام شده است و قرار است در کنفرانس بینالمللی Learning Representations ارائه شود.
الهام از جهان واقعی
ایدهی این پروژه از مسئلهای واقعی آغاز شد؛ دانشجویی میخواست یادگیری تقویتی را در مسئلهای واقعی در یکی از ایستگاههای قطار بوستون پیادهسازی کند. سازمان حمل و نقل باید قطارهای متعدد را پیشاپیش به سکوهایی کمتعداد تخصیص دهد.
این نوع مسئله، دقیقا همان نوع «برنامهریزی انعطافپذیر شغل در کارگاه» (Flexible Job Shop Scheduling) است که تیم وو روی آن چندین سال تمرکز داشته است. در این مدل، وظایف مختلف زمان اجرای متفاوتی دارند و میتوانند به هر ماشینی تخصیص پیدا کنند، در حالی که ترتیب اجراها باید حفظ شود.
از آنجایی که حل چنین مسائلی بسیار دشوار است، تکنیکی به نام بهینهسازی افق لغزان (Rolling Horizon Optimization – RHO) در آن استفاده میشود؛ در این روش، مسئله به بخشهایی با بازههای زمانی کوتاه تقسیم میشود و در هر گام فقط بخشی از آن حل میگردد.
اما در حین حرکت افق زمانی به جلو، برخی دادهها با اطلاعات پیشین همپوشانی دارند و ممکن است نیاز به محاسبه مجدد نداشته باشند — اما روش سنتی همه آنها را دوباره محاسبه میکند. اینجاست که یادگیری ماشین وارد عمل میشود.
تکنیک معرفیشده توسط تیم MIT که L-RHO نام دارد، با آموزش مدل یادگیری ماشین، یاد میگیرد کدام متغیرها در گامهای آینده نیازی به محاسبه نخواهند داشت. سپس تنها بخشهای ضروری به حلکننده داده میشود و این روند به شکل چرخهای ادامه مییابد.
نتیجه؟ کاهش حجم متغیرها میتواند باعث کاهش چشمگیر زمان محاسبه شود — آنهم در مسائلی که حجمشان به شکل نمایی رشد میکند.
روشی انعطافپذیر و قابل مقیاسپذیری
آزمایشها نشان داد روش L-RHO نسبت به سایر روشهای موجود، تا ۵۴٪ سریعتر عمل کرده و کیفیت راهحل نهایی را تا ۲۱٪ بهبود داده است. این برتری حتی در شرایط پیچیدهتر، مانند خرابی ماشینآلات یا افزایش ترافیک قطار، همچنان حفظ شده است.
این سیستم بهراحتی میتواند برای تغییر اهداف نیز تطبیق یابد — فقط کافی است مجموعهداده آموزشی جدیدی وارد شود و روش خودش الگوریتم جدید را تولید میکند.
در آینده، تیم MIT قصد دارد منطق تصمیمگیری مدل یادگیریماشین برای فریز کردن متغیرها را بهتر درک کند و از این تکنیک در بهینهسازی موجودی انبار، مسیریابی خودروها و دیگر چالشهای بهینهسازی پیچیده نیز بهره ببرد.