پژوهشگران: مدل‌های زبانی بزرگ با داده کم هم می‌توانند استدلال کنند

تحقیقات جدید نشان می‌دهد که برای آموزش مدل‌های زبانی بزرگ (LLM) در انجام وظایف استدلالی پیچیده، نیازی به حجم عظیمی از داده‌ها نیست. در حالی که پیش از این تصور می‌شد که برای این کار به هزاران نمونه نیاز است، محققان دریافته‌اند که تنها با چند صد نمونه به‌دقت انتخاب‌شده و سازمان‌یافته، می‌توان مدل‌های زبانی را برای انجام این وظایف آموزش داد.

این یافته می‌تواند تأثیر زیادی بر توسعه مدل‌های هوش مصنوعی داشته باشد، زیرا کاهش نیاز به داده‌های بزرگ، هزینه‌های پردازشی و زمان آموزش مدل‌ها را به‌شدت کاهش خواهد داد. علاوه بر این، سازماندهی بهتر داده‌ها می‌تواند منجر به بهینه‌سازی عملکرد مدل‌های زبانی در وظایف مختلف شناختی و تحلیلی شود.

این تحقیق اهمیت انتخاب داده‌های باکیفیت را برجسته می‌کند و نشان می‌دهد که دقت در انتخاب و آماده‌سازی داده‌ها می‌تواند تأثیری به‌مراتب بیشتر از حجم داده‌های آموزشی داشته باشد. بنابراین، به‌جای تمرکز بر جمع‌آوری حجم زیادی از داده، می‌توان با استفاده از داده‌های منتخب و ساختارمند، مدل‌های کارآمدی را برای انجام وظایف پیچیده استدلالی آموزش داد.

منبع

اخبار هوش مصنوعی

پژوهشگران: مدل‌های زبانی بزرگ با داده کم هم می‌توانند استدلال کنند

سینا نشاط

دیدگاهتان را بنویسید لغو پاسخ