in

ხელოვნური ინტელექტი ვიდეოზარების დროს 2D ფოტოს მოძრავ გამოსახულებად აქცევს!

პროგრამა “Vid2Vid Cameo” Nvidia-მ შექმნა

ხელოვნურ ინტელექტზე (AI) დაფუძნებული პროგრამები გამუდმებით რომ გვაოცებს, უკვე ჩვეულებრივ მოცემულობად იქცა… Nvidia-მ კიდევ ერთი ნაბიჯი გადადგა ამ სფეროში და წარადგინა AI მოდელი, რომელიც 2D გამოსახულებას ე. წ. “მოსაუბრე სახედ” აქცევს.

ალბათ, პირველი რაც წარმოიდგინეთ, დღევანდელ ყოველდღიურობას უკავშირდება… რამდენად კომფორტული იქნებოდა, ონლაინ შეხვედრებზე ხელოვნური ინტელექტის მეშვეობით ამოძრავებული ფოტოს ატვირთვა – ასე ხომ აღარ დაგჭირდებოდათ კომფორტული ღამის პერანგისა და ხალათის გამოცვლა?!

“Vid2Vid Cameo”-ს სახელით ცნობილი ეს ახალი ღრმა დასწავლის პროგრამა კამერის მიღმა ქაოსის დამალვაში დაგეხმარებათ, რაც დღევანდელ რეალობაში ნამდვილად საჭიროა. ასევე, ხელოვნური ინტელექტი დაგეხმარებათ, თქვენი თვალები პირდაპირ კამერას გაუსწოროთ, მაშინაც კი, როცა სხვა ეკრანზე საყვარელ სერიალს უყურებთ.

პროგრამა გენერაციული დაპირისპირების ქსელებზეა (GAN) დაფუძნებული. ამ მეთოდით შექმნილი ვიდეო გამოსახულება ორი ნეირონული ქსელის სინთეზით წარუდგება მაყურებელს. ერთი არის რეალისტური გარეგნობის ნიმუშების შემქმნელი გენერატორი, ხოლო მეორე იმის გარკვევას ემსახურება, ნამდვილია გამოსახულება, თუ ყალბი.

თავის მხრივ, ამ ორ ქსელს ერთი ადამიანის გამოსახულების სინთეზირება შეუძლია. უშუალოდ ვიდეოზარის დროს კამერა მომხმარებლის რეალურ დროში შესრულებულ მოძრაობებს, მიმიკებსა და საუბარს აფიქსირებს. შედეგად, ეს მონაცემები ავტომატურად აისახება ატვირთულ ფოტოზე.

გარდა ამისა, Nvidia ირწმუნება, რომ პროგრამას შეუძლია, ვიდეო კონფერენციისთვის საჭირო გამტარობა ათჯერ შეამციროს.

ძალიან მალე Vid2Vid Cameo ხელმისაწვდომი იქნება Nvidia Maxine SDK-სა და Nvidia Video Code SDK-ზე. მანამდე კი შეგიძლიათ, მისი დემო ვერსია აქ იხილოთ.

ნიკა მაჩაიძის მუსიკალური ანთოლოგიის პირველი სინგლი, “LAM​-​a97” გამოვიდა

5 კითხვა, რომელიც ციფრული ტრანსფორმაციის შესახებ უნდა დაისვას