دانشجویان MIT با پروژههای خلاقانه، تعامل انسان و هوش مصنوعی را بازتعریف میکنند
تصور کنید یک بومباکس هوشمند حرکات شما را دنبال میکند و موسیقیای را پیشنهاد میدهد که با سبک رقص شخصیتان هماهنگ باشد. این ایده پشت پروژه «Be the Beat» است، یکی از چندین پروژه خلاقانهای که توسط دانشجویان دوره 4.043/4.044 (هوش تعاملی) در دانشگاه MIT ارائه شده است. این دوره، زیر نظر مارچلو کوئلو (Marcelo Coelho) در دپارتمان معماری برگزار شد و طرحها در سیوهشتمین کنفرانس NeurIPS در دسامبر 2024 در ونکوور به نمایش درآمدند. این کنفرانس معتبر که بیش از 16 هزار شرکتکننده دارد، یکی از برترین رویدادهای علمی و پژوهشی در حوزه هوش مصنوعی و یادگیری ماشین به شمار میآید و بستری برای به نمایش گذاشتن پیشرفتهترین نوآوریها است.
این دوره به بررسی حوزه نوظهور اشیای زبان بزرگ میپردازد و چگونگی گسترش هوش مصنوعی به دنیای فیزیکی را تحلیل میکند. در حالی که «Be the Beat» امکانهای خلاقانه رقص را متحول میکند، سایر پروژههای دانشجویان حوزههایی نظیر موسیقی، داستانسرایی، تفکر نقادانه و حافظه را پوشش دادهاند و تجربیات مولد و فرمهای جدیدی از تعامل انسان و کامپیوتر ایجاد کردهاند. این پروژهها نمایی کلی از چشمانداز آینده هوش مصنوعی ارائه میدهند: فراتر از اتوماسیون، بهسوی خلق خلاقیت، بازآفرینی آموزش و تجسم دوباره تعاملات اجتماعی.
### Be the Beat
«Be the Beat» توسط ایتن چنگ، دانشجوی مهندسی مکانیک و طراحی MIT، و ژیژینگ چن، دانشجوی مهندسی مکانیک و موسیقی در MIT، توسعه داده شده است. این پروژه یک بومباکس هوشمند مجهز به هوش مصنوعی است که با تحلیل حرکات یک رقصنده، موسیقی متناسب را پیشنهاد میدهد. رقص در طول تاریخ و در فرهنگهای مختلف همواره با موسیقی هدایت شده است، اما ایدهای که رقص بتواند موسیقی ایجاد کند، کمتر موردتوجه بوده است.
این پروژه از فناوری PoseNet برای توصیف حرکات استفاده کرده و این اطلاعات را به یک مدل زبانی بزرگ میفرستد تا تحلیل سبکی انجام دهد و موسیقی با سبک، انرژی و تمپوی مشابه را بیابد. رقصندگانی که با این دستگاه تعامل داشتند، احساس کنترل بیشتری بر بیان هنری خود داشتند و این بومباکس را بهعنوان ابزاری نوآورانه برای کشف ژانرهای رقص و خلق حرکات جدید توصیف کردند.
### A Mystery for You
«A Mystery for You» توسط مرینالینی سینگا، فارغالتحصیل برنامه هنر، فرهنگ و فناوری MIT و هاوهنگ تانگ، فارغالتحصیل مدرسه طراحی دانشگاه هاروارد، طراحی شده است. این بازی آموزشی با هدف تقویت مهارتهای تفکر نقادانه و بررسی حقایق در کودکان طراحی شده است. بازی با کمک یک مدل زبانی بزرگ (LLM) و رابطی ملموس، یک تجربه تعاملی و غوطهورکننده را ایجاد میکند. بازیکنان در نقش بررسیکنندگان حقایق، به اخبار تولید شده توسط هوش مصنوعی که از رابط بازی چاپ میشود، واکنش نشان میدهند. آنها با وارد کردن ترکیبهای کارتریج به دستگاه، به بهروزرسانیهای خبری بیشتر دسترسی پیدا میکنند، سناریوهای مبهم را تحلیل کرده، شواهد را بررسی و اطلاعات متناقض را ارزیابی میکنند.
این تجربه تفکر انتقادی مصرف خبری ما را به چالش میکشد و با حذف واسطهای صفحهنمایش لمسی از تجربیات سریع و سطحی جلوگیری میکند. ترکیب رسانه آهسته و رسانه مولد جدید، بازیکنان را به سمت تعاملات عمیقتر، آگاهانهتر و شناخت بهتر اکوسیستم رسانهای امروز هدایت میکند.
### Memorscope
«Memorscope» توسط کیونووک کیم، محقق آزمایشگاه مدیا MIT، طراحی شده و دستگاهی برای خلق خاطرات جمعی است. این پروژه تعامل انسانی چهرهبهچهره را با فناوریهای پیشرفته هوش مصنوعی ادغام میکند. مثل میکروسکوپها یا تلسکوپها که جزئیات پنهان را آشکار میکنند، این دستگاه به کاربران امکان میدهد تا از طریق نگاه کردن به چهره طرف مقابل، به کشف و خلق خاطرات مشترک بپردازند.
دستگاه با استفاده از مدلهای AI مانند OpenAI و Midjourney، تفاسیر زیباییشناسانه و احساسی مختلفی را ارائه میدهد. نتیجه، فضایی پویا و تعاملی برای خاطرات مشترک است که فراتر از آلبومهای تصویری سنتی است و خاطرات را به روایتی زنده و در حال تحول تبدیل میکند.
### Narratron
«Narratron» توسط آریا بائو و یوبو ژائو، دانشجویان مدرسه طراحی هاروارد، طراحی شده است. این پروژکتور تعاملی با استفاده از تکنیکهای تئاتر سایه و مدلهای زبانی بزرگ، به خلق و اجرای داستانهای کودکان میپردازد. کاربران میتوانند شخصیتهای اصلی داستان را با حرکات دست مانند سایههای حیوانات انتخاب کنند. سیستم سپس خط داستانی را توسعه داده و شخصیتهای جدید را به عنوان سایه در صحنه معرفی میکند. داستان از طریق یک پروژکتور به صحنه اصلی نمایش داده شده و توسط یک اسپیکر در زمان واقعی روایت میشود.
ترکیب تعاملات بصری، شنیداری و بدنی در یک سیستم، خلاقیت را در داستانسرایی سایهها برانگیخته و شکلی نوین از همکاری انسان و هوش مصنوعی را به همراه دارد.
### Perfect Syntax
«Perfect Syntax» توسط کارین ناکامورا، دانشجوی سال آخر MIT، یک اثر ویدئویی است که منطق نحوی حرکت و ویدئو را بررسی میکند. این پروژه با استفاده از هوش مصنوعی، قطعات ویدئویی را بازسازی و به جریان متفاوتی از حرکت و زمان معنا میدهد. الهام گرفته از فلسفه و هنر، این اثر رابطه بین ادراک، فناوری و حرکاتی را که تجربه ما از جهان را شکل میدهند، به چالش میکشد.
**لینک منبع:** MIT News