شرکت Ai2 به تازگی مدل جدیدی به نام “Tülu 3” را معرفی کرده که بهصورت کاملاً متنباز ارائه شده است. این مدل که بر اساس شیوهای نوآورانه پس از آموزش توسعه یافته، توانسته عملکردی بهتر از مدلهای شناختهشدهای همچون DeepSeek v3 و GPT-4o ارائه دهد.
رویکرد متفاوت Ai2 در ارائه مدلهای متنباز
در حالی که مدل DeepSeek-R1 صرفاً کد منبع و وزنهای پیشآموزشدیده خود را منتشر کرد اما دادههای اصلی آموزشی آن را در دسترس عموم قرار نداد، شرکت Ai2 رویکردی شفافتر و بازتر را در پیش گرفته است. این اقدام به جامعه توسعهدهندگان و محققان اجازه میدهد با آزادی بیشتری به استفاده، بهبود و تحقیق روی این مدل بپردازند.
چرا “Tülu 3” انقلابی است؟
مدل Tülu 3 با استفاده از تکنیکهای پیشرفته پسآموزش، به سطح عملکردی بالاتر در مقایسه با سایر مدلهای همرده خود دست یافته است. این تکنیکها تمرکز بر بهینهسازی عملکرد مدل پس از پایان مرحله آموزش اولیه دارند که در نهایت منجر به تولید نتایج دقیقتر و البته سریعتر میشود.
مزایای مدل متنباز Tülu 3
- شفافیت کامل: در دسترس بودن تمامی جنبههای علمی و فنی مدل.
- فرصتهای همکاری: جامعه پژوهشی و فعالان حوزه هوش مصنوعی میتوانند به بهینهسازی و توسعه بیشتر این مدل کمک کنند.
- عملکرد بهینه: بهبود سطح دقت و پاسخدهی در مقایسه با مدلهای مشابه مانند GPT-4o و DeepSeek v3.
فرصتی تازه برای توسعه جامعه هوش مصنوعی
متنباز بودن مدل Tülu 3 به معنای ایجاد فرصتهای بیشتری برای تعاملات علمی و نوآوریهای جدید در این حوزه است. شرکت Ai2 امیدوار است با این اقدام، راه را برای کاربردهای گستردهتر و بهتر فناوری هوش مصنوعی هموار کند.
برای اطلاعات بیشتر میتوانید به لینک منبع خبر مراجعه کنید:
منبع خبر