دانشجویان MIT با پروژه‌های خلاقانه، تعامل انسان و هوش مصنوعی را بازتعریف می‌کنند

تصور کنید یک بوم‌باکس هوشمند حرکات شما را دنبال می‌کند و موسیقی‌ای را پیشنهاد می‌دهد که با سبک رقص شخصی‌تان هماهنگ باشد. این ایده پشت پروژه «Be the Beat» است، یکی از چندین پروژه خلاقانه‌ای که توسط دانشجویان دوره 4.043/4.044 (هوش تعاملی) در دانشگاه MIT ارائه شده است. این دوره، زیر نظر مارچلو کوئلو (Marcelo Coelho) در دپارتمان معماری برگزار شد و طرح‌ها در سی‌وهشتمین کنفرانس NeurIPS در دسامبر 2024 در ونکوور به نمایش درآمدند. این کنفرانس معتبر که بیش از 16 هزار شرکت‌کننده دارد، یکی از برترین رویدادهای علمی و پژوهشی در حوزه هوش مصنوعی و یادگیری ماشین به شمار می‌آید و بستری برای به نمایش گذاشتن پیشرفته‌ترین نوآوری‌ها است.

این دوره به بررسی حوزه نوظهور اشیای زبان بزرگ می‌پردازد و چگونگی گسترش هوش مصنوعی به دنیای فیزیکی را تحلیل می‌کند. در حالی که «Be the Beat» امکان‌های خلاقانه رقص را متحول می‌کند، سایر پروژه‌های دانشجویان حوزه‌هایی نظیر موسیقی، داستان‌سرایی، تفکر نقادانه و حافظه را پوشش داده‌اند و تجربیات مولد و فرم‌های جدیدی از تعامل انسان و کامپیوتر ایجاد کرده‌اند. این پروژه‌ها نمایی کلی از چشم‌انداز آینده هوش مصنوعی ارائه می‌دهند: فراتر از اتوماسیون، به‌سوی خلق خلاقیت، بازآفرینی آموزش و تجسم دوباره تعاملات اجتماعی.

### Be the Beat
«Be the Beat» توسط ایتن چنگ، دانشجوی مهندسی مکانیک و طراحی MIT، و ژی‌ژینگ چن، دانشجوی مهندسی مکانیک و موسیقی در MIT، توسعه داده شده است. این پروژه یک بوم‌باکس هوشمند مجهز به هوش مصنوعی است که با تحلیل حرکات یک رقصنده، موسیقی متناسب را پیشنهاد می‌دهد. رقص در طول تاریخ و در فرهنگ‌های مختلف همواره با موسیقی هدایت شده است، اما ایده‌ای که رقص بتواند موسیقی ایجاد کند، کمتر موردتوجه بوده است.

این پروژه از فناوری PoseNet برای توصیف حرکات استفاده کرده و این اطلاعات را به یک مدل زبانی بزرگ می‌فرستد تا تحلیل سبکی انجام دهد و موسیقی با سبک، انرژی و تمپوی مشابه را بیابد. رقصندگانی که با این دستگاه تعامل داشتند، احساس کنترل بیشتری بر بیان هنری خود داشتند و این بوم‌باکس را به‌عنوان ابزاری نوآورانه برای کشف ژانرهای رقص و خلق حرکات جدید توصیف کردند.

### A Mystery for You
«A Mystery for You» توسط مرینالینی سینگا، فارغ‌التحصیل برنامه هنر، فرهنگ و فناوری MIT و هاوهنگ تانگ، فارغ‌التحصیل مدرسه طراحی دانشگاه هاروارد، طراحی شده است. این بازی آموزشی با هدف تقویت مهارت‌های تفکر نقادانه و بررسی حقایق در کودکان طراحی شده است. بازی با کمک یک مدل زبانی بزرگ (LLM) و رابطی ملموس، یک تجربه تعاملی و غوطه‌ورکننده را ایجاد می‌کند. بازیکنان در نقش بررسی‌کنندگان حقایق، به اخبار تولید شده توسط هوش مصنوعی که از رابط بازی چاپ می‌شود، واکنش نشان می‌دهند. آن‌ها با وارد کردن ترکیب‌های کارتریج به دستگاه، به به‌روزرسانی‌های خبری بیشتر دسترسی پیدا می‌کنند، سناریوهای مبهم را تحلیل کرده، شواهد را بررسی و اطلاعات متناقض را ارزیابی می‌کنند.

این تجربه تفکر انتقادی مصرف خبری ما را به چالش می‌کشد و با حذف واسط‌های صفحه‌نمایش لمسی از تجربیات سریع و سطحی جلوگیری می‌کند. ترکیب رسانه آهسته و رسانه مولد جدید، بازیکنان را به سمت تعاملات عمیق‌تر، آگاهانه‌تر و شناخت بهتر اکوسیستم رسانه‌ای امروز هدایت می‌کند.

### Memorscope
«Memorscope» توسط کیون‌ووک کیم، محقق آزمایشگاه مدیا MIT، طراحی شده و دستگاهی برای خلق خاطرات جمعی است. این پروژه تعامل انسانی چهره‌به‌چهره را با فناوری‌های پیشرفته هوش مصنوعی ادغام می‌کند. مثل میکروسکوپ‌ها یا تلسکوپ‌ها که جزئیات پنهان را آشکار می‌کنند، این دستگاه به کاربران امکان می‌دهد تا از طریق نگاه کردن به چهره طرف مقابل، به کشف و خلق خاطرات مشترک بپردازند.

دستگاه با استفاده از مدل‌های AI مانند OpenAI و Midjourney، تفاسیر زیبایی‌شناسانه و احساسی مختلفی را ارائه می‌دهد. نتیجه، فضایی پویا و تعاملی برای خاطرات مشترک است که فراتر از آلبوم‌های تصویری سنتی است و خاطرات را به روایتی زنده و در حال تحول تبدیل می‌کند.

### Narratron
«Narratron» توسط آریا بائو و یو‌بو ژائو، دانشجویان مدرسه طراحی هاروارد، طراحی شده است. این پروژکتور تعاملی با استفاده از تکنیک‌های تئاتر سایه و مدل‌های زبانی بزرگ، به خلق و اجرای داستان‌های کودکان می‌پردازد. کاربران می‌توانند شخصیت‌های اصلی داستان را با حرکات دست مانند سایه‌های حیوانات انتخاب کنند. سیستم سپس خط داستانی را توسعه داده و شخصیت‌های جدید را به عنوان سایه در صحنه معرفی می‌کند. داستان از طریق یک پروژکتور به صحنه اصلی نمایش داده شده و توسط یک اسپیکر در زمان واقعی روایت می‌شود.

ترکیب تعاملات بصری، شنیداری و بدنی در یک سیستم، خلاقیت را در داستان‌سرایی سایه‌ها برانگیخته و شکلی نوین از همکاری انسان و هوش مصنوعی را به همراه دارد.

### Perfect Syntax
«Perfect Syntax» توسط کارین ناکامورا، دانشجوی سال آخر MIT، یک اثر ویدئویی است که منطق نحوی حرکت و ویدئو را بررسی می‌کند. این پروژه با استفاده از هوش مصنوعی، قطعات ویدئویی را بازسازی و به جریان متفاوتی از حرکت و زمان معنا می‌دهد. الهام گرفته از فلسفه و هنر، این اثر رابطه بین ادراک، فناوری و حرکاتی را که تجربه ما از جهان را شکل می‌دهند، به چالش می‌کشد.

**لینک منبع:** MIT News

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *