Meta-ს უახლესი AI მოდელი ყველაზე დიდია მათ შორის, რაც ბრენდს გამოუშვია. Llama 3.1 405B-ზე გესაუბრებით, მოდელზე, რომელიც 405 მილიარდ პარამეტრს მოიცავს. ეს უკანასკნელი კი, უხეშად რომ ვთქვათ, მოდელის პრობლემის გადაჭრის უნარებზე მეტყველებს — რაც უფრო მეტი პარამეტრი აქვს, მით უკეთეს შედეგებს გვთავაზობს.
მართალია, ამ მონაცემებით Llama 3.1 405B უდიდესი ღია მოდელი არ არის, მაგრამ ბოლო დროს გამოშვებულთა შორის მაინც ღირსეულად ინარჩუნებს აღნიშნულ სტატუსს. აქ ყურადღებას ამახვილებენ Nvidia-სთან თანამშრომლობაზე, რომელიც ერთ-ერთ მთავარ პარტნიორს წარმოადგენს და გვეუბნებიან, რომ მოდელი 16 000 Nvidia H100 GPU-ზე გაწვრთნეს, უახლესი ტრენინგისა და განვითარების ტექნიკებით, რომლებიც, მეტას თქმით, მას კონკურენტულ უპირატესობას ანიჭებს GPT-4o-სთან და Claude 3.5 Sonnet-თან მიმართებით. ასე მეტოქეობასაც უწევს Anthropic-ს, Google-სა და OpenAI-ის.
„Llama 3.1 405B პირველი ღიად ხელმისაწვდომი მოდელია, რომელიც ეჯიბრება ტოპ AI მოდელებს, როცა საქმე უახლესი შესაძლებლობების ზოგად ცოდნას, მათემატიკას, ხელსაწყოების გამოყენებასა და მრავალ ენაზე თარგმნას ეხება“, — აცხადებენ მეტაში.
ეს ამბავი იმასაც მიგვანიშნებს, რომ მეტას აქვს უნარი, დიდ ენობრივ მოდელებს შეეჯიბროს. თუმცა OpenAI-სა და Google-ის უახლესი მოდელებისგან განსხვავებით, Llama „მულტიმოდალური“ არ არის, რაც იმას ნიშნავს, რომ სურათებს, აუდიოსა და ვიდეოებს ვერ გაუმკლავდება. მიუხედავად ამისა, მეტას თქმით, მოდელი ბევრად უკეთესია პროგრამული უზრუნველყოფის გამოყენებაში.
ფაქტი ის არის, რომ ეს ბრენდის ყველაზე დიდი ტექსტზე დაფუძნებული ენობრივი მოდელია. Meta ახლა უფრო ფართო კონტექსტს და კიდევ 8 ენის მხარდაჭერას გვთავაზობს, რომელთა შორისაა ფრანგული, გერმანული, იტალიური, პორტუგალიური, ესპანური, ჰინდი… საინტერესოა, რომ კომპანიამ Llama 3-ის პატარა ვერსიებიც გააახლა: Llama 3.1 მოდელიც ახლა მეტი ენის მხარდაჭერასა და კონტექსტს გვპირდება.
თავად მარკ ცუკერბერგი კი ფიქრობს, რომ აღნიშნულ მოდელებზე საჯარო წვდომა დადებითად აისახება ტექნოლოგიურ ეკოსისტემაზე…