Anthropic-მა მისი ფლაგმანური მოდელის უახლესი ვერსია Opus 4.5 გამოუშვა და, როგორც მოსალოდნელი იყო, მოწინავე პოზიციები დაიკავა ისეთ ტესტებში, როგორებიცაა კოდირების SWE-Bench თუ Terminal-bench, ხელსაწყოების გამოყენების tau2-bench თუ MCP Atlas და ზოგადი პრობლემების გადაჭრის ARC-AGI 2, GPQA Diamond…
აღსანიშნავია, რომ Opus 4.5 პირველი მოდელია, რომელმაც SWE-Bench-ის მიერ ვერიფიცირებულ ტესტში 80%-ზე მეტი აიღო! ამასთან, Anthropic-მა ხაზი გაუსვა Opus-ის კომპიუტერის და ცხრილების გამოყენების ხელსაწყოებს და რამდენიმე პარალელური პროდუქტი გამოუშვა, რათა ეჩვენებინა, როგორ მუშაობს ეს მოდელი მსგავს პარამეტრებში.
Opus 4.5-თან ერთად, Anthropic უფრო ფართოდ ხელმისაწვდომს გახდის თავის Claude for Chrome და Claude for Excel პროდუქტებს, რომლებიც მანამდე საპილოტე ვერსიით იყო ჩაშვებული. როგორც ამბობენ, Chrome Extension Max-ის ყველა მომხმარებლისთვის იქნება ხელმისაწვდომი, ხოლო Excel-ზე ორიენტირებული მოდელი Max-ის, Team-ის და Enterprise-ის გამომწერებისთვის.
მეტიც, Opus 4.5-ს უკეთესი მეხსიერება ექნება გრძელი კონტექსტის მქონე ოპერაციებისთვის, რაც მნიშვნელოვან ცვლილებებს მოითხოვდა იმაში, თუ როგორ მართავს მოდელი მის მეხსიერებას… იმასაც გვეუბნებიან, რომ განახლებების უმეტესობა აგენტურად გამოყენების შემთხვევების გათვალისწინებით განხორციელდა, განსაკუთრებით კი იმ სცენარებში, სადაც Opus წამყვანი აგენტივით მოქმედებს და ქვეაგენტების ჯგუფსაც ხელმძღვანელობს.
სწორედ ამ შესაძლებლობებით აპირებს Opus 4.5 ახლად გამოშვებულ AI მოდელებთან კონკურენციაში ჩაბმას, იქნება ეს OpenAI-ის GPT 5.1 თუ Google-ის Gemini 3.













