OpenAI-მ აღმოაჩინა მტკიცებულებები, რომ ჩინურმა AI სტარტაპმა DeepSeek-მა ფარულად გამოიყენა OpenAI-ს ტექნოლოგიით შექმნილი მონაცემები საკუთარი AI მოდელების გასაუმჯობესებლად. თუ ეს სიმართლეა, გამოდის, რომ DeepSeek OpenAI-ს მომსახურების პირობებს არღვევს.
DeepSeek-მა თავი ამ თვის დასაწყისში R1-ის გამოშვებით გამოიჩინა. R1 მსჯელობის მოდელია, რომელსაც მოთხოვნის რამდენიმე ეტაპად გააზრება შეუძლია. R1 აგებულია DeepSeek-ის ფლაგმან ხელოვნური ინტელექტის მოდელზე – V3-ზე, რომელიც, მათი განცხადებით, მხოლოდ 5.5 მილიონ დოლარად შეიქმნა – ეს თანხა გაცილებით ნაკლებია იმ ათეულობით და ასეულობით მილიონზე, რასაც OpenAI, Meta და Microsoft ხარჯავენ მსგავსი შედეგების მისაღწევად.
Bloomberg-ის ინფორმაციით, 2024 წლის შემოდგომაზე Microsoft-ის (OpenAI-ს ერთ-ერთი მთავარი პარტნიორი) უსაფრთხოების მკვლევრებმა შენიშნეს ჯგუფი, რომელიც სავარაუდოდ DeepSeek-თან იყო დაკავშირებული და დიდი რაოდენობით მონაცემებს გადასცემდა OpenAI-ს API-ის გამოყენებით. ეს აჩენდა ეჭვებს, რომ DeepSeek ე.წ. „დისტილაციის“ პროცესს მიმართავდა.
თეთრი სახლის AI და კრიპტო მრჩეველმა დევიდ საქსმა განაცხადა, რომ არსებობს ცოდნის დისტილაციის მტკიცებულებები“ DeepSeek-მა OpenAI-ს მოდელებიდან. საქსის თქმით, დისტილაცია არის პროცესი, როდესაც „მოსწავლე“ მოდელი სწავლობს „მასწავლებელი“ ან „მშობელი“ მოდელისგან. „მოსწავლე“ მოდელი მილიონობით კითხვას უსვამს „მასწავლებელ“ მოდელს და პასუხებიდან მიღებული მონაცემები საშუალებას აძლევს მიბაძოს მის მსჯელობის პროცესს.
აღსანიშნავია, რომ დისტილაცია არ არის უკანონო და ღია წყაროს მოდელების პროვაიდერები, როგორიცაა Meta-ს Llama, დეველოპერებს მოუწოდებენ მოახდინონ მათი მოდელების დისტილაცია, უკეთესი პროდუქტების შესაქმნელად. თუმცა OpenAI-ის ტექნოლოგია დახურული წყაროა და მათი მომსახურების პირობები მკაფიოდ კრძალავს „მონაცემების ან შედეგების ავტომატურ ან პროგრამულ ექსტრაქციას“ ან „შედეგების გამოყენებას OpenAI-ს კონკურენტი მოდელების შესაქმნელად“.
OpenAI-ის წარმომადგენლის თქმით: „ჩვენ ვიცით, რომ ჩინეთში ჯგუფები აქტიურად მუშაობენ ისეთი მეთოდების გამოყენებაზე, როგორიცაა დისტილაცია, აშშ-ს მოწინავე AI მოდელების რეპლიკაციისთვის. ჩვენ ვსწავლობთ იმ გარემოებას, რომ DeepSeek-მა შესაძლოა არასათანადოდ მოახდინა ჩვენი მოდელების დისტილაცია და გავაზიარებთ ინფორმაციას, როგორც კი მეტი გვეცოდინება. ჩვენ ვიღებთ აგრესიულ, პროაქტიულ კონტრზომებს ჩვენი ტექნოლოგიის დასაცავად და გავაგრძელებთ მჭიდრო თანამშრომლობას აშშ-ის მთავრობასთან აქ შექმნილი ყველა მოდელების დასაცავად“.
ზოგიერთისთვის ეს სიტუაცია ირონიულია. კომპანია, რომელიც თავად გამოირჩევა სხვისი კონტენტის უნებართვოდ გამოყენებით, ახლა საკუთარი ინტელექტუალური საკუთრების დარღვევის წინააღმდეგ იბრძვის. OpenAI-მ თავისი მძლავრი მოდელები ინტერნეტიდან შეგროვებული მონაცემების საფუძველზე ააგო და რამდენიმე სასამართლო დავა, მათ შორის New York Times-ისა და ავტორთა ჯგუფის მიერ შეტანილი სარჩელები, ამტკიცებს, რომ ეს მონაცემები მოიცავდა საავტორო უფლებებით დაცულ მილიონობით სტატიასა და ისტორიას, რომლებიც ნებართვის გარეშე იქნა მოპოვებული. ახლა კი OpenAI თავად ადანაშაულებს AI კომპანიას მისი ნამუშევრის უნებართვოდ მოპარვაში.
საკითხი განსაკუთრებით აქტუალურია AI ინდუსტრიაში არსებულ ფონზე, სადაც ტექნოლოგიური კონკურენცია აშშ-სა და ჩინეთს შორის სულ უფრო მწვავდება. დავა DeepSeek-სა და OpenAI-ს შორის შესაძლოა წინასწარი ნიშანი იყოს იმისა, თუ როგორი გამოწვევების წინაშე იდგება AI ინდუსტრია მომავალში.
წყარო: Inc.