شرکت **Anthropic** ادعا میکند که روش جدید امنیتی هوش مصنوعی آنها قادر به جلوگیری از ۹۵ درصد موارد نفوذ کاربران (Jailbreaks) است. این شرکت همچنین از متخصصان حوزه امنیت (که به اصطلاح “Red Teamers” نامیده میشوند) دعوت کرده است تا این سیستم امنیتی را آزمایش کرده و نقاط ضعف آن را پیدا کنند.
### **راهکار جدید امنیتی Anthropic برای هوش مصنوعی Claude**
Anthropic، شرکتی پیشرو در توسعه هوش مصنوعی، اعلام کرده است که روش امنیتی جدیدی برای سیستم هوش مصنوعی Claude طراحی کرده که قادر است از بیشتر تلاشهای نفوذ به سیستم جلوگیری کند. بر اساس اطلاعات اولیه، این اقدام پاسخی به تلاشهای گسترده برای دور زدن قوانین و محدودیتهای از پیش تعیینشده در هوش مصنوعی است.
در حالی که سیستمهای پیشین هوش مصنوعی در برابر هکها و دستکاریهای کاربر آسیبپذیر بودند، روش جدید تعیینشده توسط این شرکت توانسته نتایج امیدوارکنندهای ارائه دهد و نزدیک به ۹۵ درصد از تلاشهای نفوذ را مسدود کند.
### **چرا امنیت هوش مصنوعی مهم است؟**
هوش مصنوعی امروزه در بخشهای مختلفی از جمله فناوری، سلامت، اقتصاد و آموزش به کار گرفته میشود. با توجه به اینکه این سیستمها تواناییهای شگفتانگیزی برای حل مشکلات دارند، وجود ضعفهای امنیتی میتواند خطرات جدی برای کاربران و سازمانها ایجاد کند. حملات Jailbreak معمولاً به دنبال دسترسی به اطلاعات حساس یا تغییر رفتار مدلهای هوش مصنوعی هستند، که میتواند به سوءاستفاده منجر شود.
راهکار جدید Anthropic نه تنها از کاربران در برابر چنین مشکلاتی محافظت میکند، بلکه راهی برای اطمینان از اجرای اصول اخلاقی در استفاده از هوش مصنوعی منتشر شده نیز معرفی کرده است.
### **نتایج اولیه و گزارشها**
البته از طرف دیگر، گزارشهایی مبنی بر موفقیت اندک تلاشهای نفوذ به این سیستم منتشر شده است. Anthropic تأیید کرده که برخی از این موفقیتها نه به دلیل ضعف در سیستم امنیتی، بلکه به علت اشکالات فنی یا نقصهای کوچک رخ داده است. آنها تأکید کردند که این مشکلات اصلاح شده و از متخصصان امنیتی دعوت کردهاند تا مجدداً سیستم را آزمایش کنند.
در واقع، این دعوت به تیمهای تخصصی امنیت بهنوعی اقدامی شفافیتمحور است که نشان میدهد Anthropic به کیفیت و عملکرد راهکار خود اطمینان دارد.
### **آزمون و آزمایش توسط متخصصان امنیتی**
این شرکت از متخصصان امنیتی که در یافتن نقاط آسیبپذیر مهارت دارند، خواسته تا سیستم جدید Claude را محک بزنند. ارائه چنین فرصتی نه تنها به تکامل فناوری کمک میکند، بلکه نقش موثری در ایجاد اعتماد کاربران به فناوریهای مبتنی بر هوش مصنوعی ایفا خواهد کرد.
### **نتیجهگیری**
روش جدید Anthropic گامی دیگر در مسیر تضمین ایمنی و پایداری سیستمهای هوش مصنوعی به شمار میآید. این ابتکار عمل، نشاندهنده اهمیت امنیت در جهان امروز است، جایی که هوش مصنوعی بخش حیاتی زندگی شخصی و سازمانی ما را تشکیل داده است.
برای کسب اطلاعات بیشتر درباره جزئیات این اقدام، میتوانید [اینجا](https://venturebeat.com/security/anthropic-claims-new-ai-security-method-blocks-95-of-jailbreaks-invites-red-teamers-to-try/) کلیک کنید.