in

OpenAI-ის „ღია“ მოდელი აჩვენებს, თუ რამდენად შეიცვალა კომპანია და AI ორ წელიწადში

OpenAI-ის გენერალურმა დირექტორმა სემ ალტმანმა განაცხადა, რომ კომპანია რამდენიმე თვეში, მსჯელობის უნარიანი მძლავრი ახალი ღია ენობრივი მოდელის გამოშვებას გეგმავს. ეს მნიშვნელოვანი ცვლილებაა კომპანიისთვის, რომელიც 2019 წლიდან მოდელებს დახურულად და საიდუმლოდ ინახავდა. განცხადება მოულოდნელი არ ყოფილა: იანვარში ჩინური რევოლუციური ღია-კოდის მოდელის DeepSeek-R1 გამოჩენის შემდეგ, ალტმანმა Reddit AMA-ზე აღიარა, რომ მისი კომპანია „ისტორიის არასწორ მხარეს იდგა“ და მიანიშნა, რომ OpenAI-ის ღია-კოდის მოდელი რეალური შესაძლებლობა იყო.

ღია მოდელები შეიძლება უფრო ხარჯთეფექტური იყოს კორპორაციებისთვის, რომლებიც ცდილობენ AI-ის გამოყენებას, რადგან ისინი საშუალებას აძლევენ ბიზნესებს თავად უმასპინძლონ და დაიცვან მოდელები – თავიდან აიცილონ ხშირად სარისკო პერსპექტივა, გაგზავნონ დაპატენტებული მონაცემები API-ის საშუალებით მესამე მხარის პროვაიდერთან და იხადონ ამისთვის საფასური.

კორპორაციულ მომხმარებელს არ უწევს გადახდა ღია მოდელის გამოყენებისთვის. ზოგიერთი AI ლაბორატორია გამოსცემს ღია მოდელებს ბაზარზე კრედიტის მოსაპოვებლად – პოტენციურად გზის გაკვალვით, API წვდომის მათ უფრო მძლავრ დახურულ მოდელებზე გასაყიდად. ღია მოდელების ადრეულ ეტაპზე გამოშვებით, ფრანგულმა AI კომპანიამ Mistral-მა დაიმკვიდრა თავი, როგორც უმაღლესი დონის AI ლაბორატორიამ. ზოგიერთი AI ლაბორატორია გამოსცემს ღია-კოდის მოდელებს, შემდეგ იღებს საკონსულტაციო ანაზღაურებას დიდი საწარმოების დახმარებით მოდელების დანერგვასა და ოპტიმიზაციაში დროთა განმავლობაში.

Meta-ს Llama მოდელები ყველაზე ფართოდ დანერგილი „ღია“ მოდელებია – თუმცა კომპანია ზღუდავს განმეორებით გამოყენებასა და გადანაწილებას და საიდუმლოდ ინახავს სატრენინგო მონაცემებსა და კოდს. Meta-ს განსხვავებული მიზეზები ჰქონდა თავისი მოდელების გასაცემად. Mistral-ისა და სხვების განსხვავებით, ის ფულს შოულობს მომხმარებლების მონიტორინგითა და მიზნობრივი რეკლამებით. ზაკერბერგი განაგრძობს Llama კვლევის დაფინანსებას, რადგან ეს Meta-ს უფლებას აძლევს თავი „AI კომპანიად“ მოიხსენიოს.

OpenAI-ს ახლა საკუთარი მიზეზები აქვს ღია-წონიანი მოდელის გამოსაშვებად. თვრამეტი თვის წინ, OpenAI უდავო ჩემპიონი იყო უახლესი AI მოდელების სფეროში. მაგრამ მას შემდეგ, LLM-ების გამოშვებამ, როგორიცაა Google-ის ძლიერი Gemini 2.0 და DeepSeek-ის ღია-კოდის R1, კონკურენცია გაზარდა.

ბაზარი შეიცვალა და OpenAI თავადაც განვითარდა. Meta-ს მსგავსად, OpenAI არ არის პირდაპირ და მხოლოდ მის მოდელებზე დამოკიდებული შემოსავლისთვის. თავის მოდელებზე წვდომის გაყიდვა API-ის საშუალებით, აღარ არის კომპანიის შემოსავლის მთავარი წყარო. ახლა, მისი შემოსავლის უმეტესი ნაწილი, რომ არაფერი ვთქვათ მის თავბრუდამხვევ 300 მილიარდ დოლარიან შეფასებაზე, მოდის ChatGPT-ის გამოწერების გაყიდვიდან (უმეტესობა ინდივიდუალურ მომხმარებლებზე). OpenAI-ის ნამდვილი სუპერძალა ოჯახის სახელის მქონე სამომხმარებლო AI ბრენდად ყოფნა გახლავთ.

AI ვიდეო გენერაცია საშიშად კარგი ხდება

AI-ვიდეო-გენერაციის ხელსაწყოები სწრაფად ვითარდებიან, რაც სულ უფრო ართულებს ყოველდღიური ინტერნეტ მომხმარებლებისთვის ნამდვილსა და გენერირებულ ვიდეოს შორის განსხვავების დანახვას. ეს შეიძლება კარგი იყოს მცირე კომპანიებისთვის, რომლებიც ცდილობენ პრიალა, შემოქმედებითი ან ამბიციური რეკლამების წარმოებას სტანდარტული ღირებულების მცირე ნაწილად. მაგრამ ეს შეიძლება ცუდიც იყოს, თუ არაკეთილმოსურნეები გამოიყენებენ ტექნოლოგიას ფიშინგ თაღლითობებში ან დეზინფორმაციის გასავრცელებლად.

AI სტარტაპმა Runway-მა გამოაქვეყნა დემო ვიდეო Gen-4-ის კონტროლის ხელსაწყოების შესახებ, რაც წარმოების პროცესს საკმაოდ ადვილს ხდის, არატექნიკური პირებისთვისაც კი). Runway-ს ჰყავს რამდენიმე მძლავრი კონკურენტი AI ვიდეო სივრცეში მუდმივი პრეტენდენტების სახით, მათ შორის Google-ის Veo 2 მოდელი, OpenAI-ის Sora, Adobe Firefly, Pika და Kling.

AI საზოგადოებაში უკვე დიდი ხანია კამათობენ იმაზე, არის თუ არა ჩვენი მოდელების მათემატიკური უნარების ტესტირების მიმდინარე მეთოდები „გაფუჭებული“. მიუხედავად იმისა, რომ არსებული მათემატიკური ორიენტირები შეიცავს ზოგიერთ ძალიან რთულ პრობლემას, ეს პრობლემები (და მათი გადაწყვეტები) ონლაინ საკმაოდ სწრაფად ქვეყნდება. შემაშფოთებელი ისაა, რომ შეფასების დროს, მოდელებს შეიძლება უკვე შეხვედროდათ ტესტის პრობლემები და პასუხები მათ სატრენინგო მონაცემებში.

ახალი ორიენტირი სახელწოდებით MathArena ამ პრობლემების აღმოსაფხვრელად შეიქმნა. MathArena მათემატიკურ პრობლემებს იღებს ძალიან ახალი მათემატიკური შეჯიბრებებიდან და ოლიმპიადებიდან, რომლებსაც აქვთ აშკარა სტიმული, რომ თავიანთი პრობლემები საიდუმლოდ შეინახონ. MathArena-ს მკვლევრებმა ასევე შექმნეს შეფასების ადმინისტრირების საკუთარი სტანდარტული მეთოდი, რაც ნიშნავს, რომ AI მოდელის დეველოპერებს არ შეუძლიათ თავიანთ მოდელებს მისცენ უპირატესობა შეფასების სისტემაში ცვლილებებით.

MathArena-მ ახლახანს გამოაქვეყნა უახლესი ორიენტირის შედეგები, რომელიც მოიცავს კითხვებს 2025 წლის აშშ-ის მათემატიკის ოლიმპიადიდან. ტესტი მოითხოვდა არა მხოლოდ სწორ პასუხს, არამედ მოდელის მიერ განვლილი თითოეული მსჯელობის ნაბიჯის აღწერას.

შედეგები არასახარბიელოა. ზოგიერთმა მსოფლიოში ყველაზე მძლავრმა და აღიარებულმა მოდელმა ჩააბარა ტესტი, თუმცა ვერცერთმა არ მიიღო 5%-ზე მეტი ქულა. საუკეთესო ქულა მიიღო DeepSeek-ის R1 მოდელმა, რომელმაც დაიმსახურა 4.76%. Google-ის Gemini 2.0 Flash Thinking მოდელმა მიიღო 4.17%. Anthropic-ის Claude 3.7 Sonnet (Thinking) მოდელმა მიიღო 3.65%. OpenAI-ის უახლესმა აზროვნების მოდელმა, o3 mini, მიიღო 2.08%. Google-ის ახალმა Gemini 2.5 Pro მოდელმა კი მიიღო 24.4%, სხვა ტოპ მოდელებზე დიდი უპირატესობით.

შედეგები მიანიშნებს რამდენიმე შესაძლებლობას: იქნებ MathArena შეიცავს გაცილებით უფრო რთულ კითხვებს, ვიდრე სხვა ორიენტირები, ან LLM-ები არ არიან კარგები თავიანთი მსჯელობის ნაბიჯების ახსნაში, ან ადრეული მათემატიკური ორიენტირების ქულები საეჭვოა, რადგან LLM-ებს უკვე ენახათ პასუხები. როგორც ჩანს, LLM-ებს კვლავ აქვთ საშინაო დავალება შესასრულებელი.

წყარო: Fastcompany

ახალი კამპუსი და Webster University Tbilisi-ს განვითარების ახალი ეტაპი

არგენტინული სალსა დრაკონის კბილებით — Piropo-ს ბრენდინგი