تحقیقات جدید نشان میدهد که برای آموزش مدلهای زبانی بزرگ (LLM) در انجام وظایف استدلالی پیچیده، نیازی به حجم عظیمی از دادهها نیست. در حالی که پیش از این تصور میشد که برای این کار به هزاران نمونه نیاز است، محققان دریافتهاند که تنها با چند صد نمونه بهدقت انتخابشده و سازمانیافته، میتوان مدلهای زبانی را برای انجام این وظایف آموزش داد.
این یافته میتواند تأثیر زیادی بر توسعه مدلهای هوش مصنوعی داشته باشد، زیرا کاهش نیاز به دادههای بزرگ، هزینههای پردازشی و زمان آموزش مدلها را بهشدت کاهش خواهد داد. علاوه بر این، سازماندهی بهتر دادهها میتواند منجر به بهینهسازی عملکرد مدلهای زبانی در وظایف مختلف شناختی و تحلیلی شود.
این تحقیق اهمیت انتخاب دادههای باکیفیت را برجسته میکند و نشان میدهد که دقت در انتخاب و آمادهسازی دادهها میتواند تأثیری بهمراتب بیشتر از حجم دادههای آموزشی داشته باشد. بنابراین، بهجای تمرکز بر جمعآوری حجم زیادی از داده، میتوان با استفاده از دادههای منتخب و ساختارمند، مدلهای کارآمدی را برای انجام وظایف پیچیده استدلالی آموزش داد.