شرکت Anthropic مدل هوش مصنوعی Cloud Opus 4.6 را با عملکرد تعاملی بهبود یافته عرضه می‌کند.

باشگاه خبرنگاران جوان؛ جواد فراهانی - شرکت Anthropic مدل هوش مصنوعی جدید خود، Cloud Opus 4.6، را که به‌روزرسانی بزرگی برای مدل اصلی Opus 4 آن است، عرضه کرده است. این مدل جدید با بهبود عملکرد پایدار در وظایف پیچیده، به‌ویژه در مهندسی نرم‌افزار و زمینه‌های شناختی فشرده، محدودیت‌های کلیدی نسخه قبلی را برطرف می‌کند.

در حالی که Cloud Opus 4.5 قادر به انجام وظایف استدلال پیشرفته بود، اغلب با زمینه‌های بلندمدت و حالت‌های مرزی در پایگاه‌های داده بزرگ مشکل داشت. نسخه بتای Opus 4.6 این مشکل را با یک پنجره زمینه تا یک میلیون توکن حل می‌کند.

Claude Opus 4.6: پشتیبانی گسترده از زمینه و ویژگی‌های جدید

شرکت Anthropic آخرین نسخه مدل خود را در یک پست وبلاگی اعلام کرد و توضیح داد که برای اولین بار در سری Opus، نسخه بتا از یک پنجره زمینه تا یک میلیون کاراکتر پشتیبانی می‌کند. این امر امکان پردازش حجم عظیمی از اطلاعات را فراهم می‌کند و در عین حال، افت عملکرد را در طول تعاملات طولانی به حداقل می‌رساند، که پیشرفت قابل توجهی نسبت به محدودیت ۲۰۰۰۰۰ کاراکتری در مدل‌های قبلی است.

Clude Opus 4.6 همچنین شامل ویژگی‌های جدیدی مانند فشرده‌سازی متن است که داده‌های قدیمی‌تر را در طول وظایف طولانی خلاصه و به‌روزرسانی می‌کند. این مدل شامل استدلال تطبیقی ​​است که پیچیدگی پرس‌وجو را ارزیابی می‌کند تا در صورت نیاز، قدرت پردازش بیشتری را به همراه کنترل‌های کم‌بهره تا پربهره‌وری برای بهینه‌سازی سرعت، هوش و مقرون‌به‌صرفه بودن اختصاص دهد.

پیشی گرفتن از معیار‌ها و نسخه‌های قبلی

طبق ارزیابی‌های داخلی شرکت، Claude Opus 4.6 در آزمون‌های متعدد به امتیازات رکوردشکنی دست یافته است. این مدل در Terminal-Bench 2.0 برای مهارت‌های خط فرمان و در Humanity’s Last Exam برای استدلال بین رشته‌ای، از مدل‌های پیشرو پیشی گرفت. در ارزیابی‌های تعاملی مانند GDPval-AA، با تمرکز بر وظایف مالی و حقوقی، GPT-5.2 از OpenAI را با تقریباً ۱۴۴ امتیاز Elo و Opus 4.5 را با تقریباً ۱۹۰ امتیاز بهتر کرد.

علاوه بر این، نمرات SWE-bench Verified آن با برنامه‌نویسی بهبود یافته به طور متوسط ​​۸۱.۴۲٪ بود، در حالی که آزمایش‌های CyberGym عملکرد قوی در اصول اولیه را نشان دادند.

ویژگی‌های امنیتی و حفاظتی پیشرفته

Anthropic تأکید کرد که ایمنی و امنیت همچنان اولویت اصلی مدل جدید است. این شرکت اظهار داشت که این مدل در بررسی‌های امنیتی با رقبای خود برابری می‌کند یا از آنها پیشی می‌گیرد، با نرخ پایین جعل یا چاپلوسی و کمترین تمایل به رد بیش از حد در بین نسخه‌های اخیر. این شرکت شش آزمایش امنیت سایبری جدید را برای شناسایی سوءاستفاده‌های احتمالی و تسریع برنامه‌های دفاعی مانند اسکن آسیب‌پذیری در کد منبع باز اضافه کرده است.

قابلیت‌های برنامه‌نویسی و تجاری پیشرفته

در برنامه‌نویسی، Opus 4.6 به طور مستقل مخازن بزرگ را مدیریت می‌کند، بررسی‌ها و اشکال‌زدایی کد با دقت بالا را انجام می‌دهد و تیم‌های توسعه موازی را از طریق Cloud Code ایجاد می‌کند. در گردش‌های کاری تجاری، تجزیه و تحلیل مالی را انجام می‌دهد، مستندات تولید می‌کند و جستجوی چند مرحله‌ای را در ابزار‌هایی مانند Cloud در Excel انجام می‌دهد که اکنون برای داده‌های بدون ساختار و وظایف طولانی به‌روزرسانی شده است. نسخه جستجوی Cloud در PowerPoint این قابلیت‌ها را به ارائه‌ها گسترش می‌دهد. در زمینه‌هایی مانند زیست‌شناسی محاسباتی، این نسخه تقریباً دو برابر عملکرد Opus 4.5 را ارائه می‌دهد و از اکتشافات علمی پشتیبانی می‌کند.

دسترسی و قیمت‌گذاری

Clude Opus 4.6 اکنون از طریق وب‌سایت، برنامه‌های موبایل و دسکتاپ، API شرکت Anthropic و ارائه‌دهندگان اصلی فضای ابری در دسترس است. قیمت این API برای هر میلیون توکن ورودی ۵ دلار و برای هر میلیون توکن خروجی ۲۵ دلار است و برای زمینه‌های گسترده‌تر هزینه‌های اضافی نیز دریافت می‌شود.

منبع: الیوم السابع

اخبار پیشنهادی
تبادل نظر
آدرس ایمیل خود را با فرمت مناسب وارد نمایید.
captcha
آخرین اخبار