اخبار هوش مصنوعی

عرضه مدل متن‌باز Tülu 3 توسط Ai2: پیشی گرفتن از DeepSeek v3 و GPT-4 با رویکرد نوین پساآموزشی

شرکت Ai2 به تازگی مدل جدیدی به نام “Tülu 3” را معرفی کرده که به‌صورت کاملاً متن‌باز ارائه شده است. این مدل که بر اساس شیوه‌ای نوآورانه پس از آموزش توسعه یافته، توانسته عملکردی بهتر از مدل‌های شناخته‌شده‌ای همچون DeepSeek v3 و GPT-4o ارائه دهد.

رویکرد متفاوت Ai2 در ارائه مدل‌های متن‌باز

در حالی که مدل DeepSeek-R1 صرفاً کد منبع و وزن‌های پیش‌آموزش‌دیده خود را منتشر کرد اما داده‌های اصلی آموزشی آن را در دسترس عموم قرار نداد، شرکت Ai2 رویکردی شفاف‌تر و بازتر را در پیش گرفته است. این اقدام به جامعه توسعه‌دهندگان و محققان اجازه می‌دهد با آزادی بیشتری به استفاده، بهبود و تحقیق روی این مدل بپردازند.

چرا “Tülu 3” انقلابی است؟

مدل Tülu 3 با استفاده از تکنیک‌های پیشرفته پس‌آموزش، به سطح عملکردی بالاتر در مقایسه با سایر مدل‌های هم‌رده خود دست یافته است. این تکنیک‌ها تمرکز بر بهینه‌سازی عملکرد مدل پس از پایان مرحله آموزش اولیه دارند که در نهایت منجر به تولید نتایج دقیق‌تر و البته سریع‌تر می‌شود.

مزایای مدل متن‌باز Tülu 3

شفافیت کامل: در دسترس بودن تمامی جنبه‌های علمی و فنی مدل.
فرصت‌های همکاری: جامعه پژوهشی و فعالان حوزه هوش مصنوعی می‌توانند به بهینه‌سازی و توسعه بیشتر این مدل کمک کنند.
عملکرد بهینه: بهبود سطح دقت و پاسخ‌دهی در مقایسه با مدل‌های مشابه مانند GPT-4o و DeepSeek v3.

فرصتی تازه برای توسعه جامعه هوش مصنوعی

متن‌باز بودن مدل Tülu 3 به معنای ایجاد فرصت‌های بیشتری برای تعاملات علمی و نوآوری‌های جدید در این حوزه است. شرکت Ai2 امیدوار است با این اقدام، راه را برای کاربردهای گسترده‌تر و بهتر فناوری هوش مصنوعی هموار کند.

برای اطلاعات بیشتر می‌توانید به لینک منبع خبر مراجعه کنید:
منبع خبر

سینا نشاط

مدیرعامل ChatQT 🔹 متخصص بازاریابی در سطح بین المللی 🔹 محقق هوش‌مصنوعی 🔹 کارآفرین استارت‌آپی

دیدگاهتان را بنویسید لغو پاسخ