in

ChatGPT-ს შეუძლია ხმის კლონირება და წინადადების დასრულება, ნებართვის გარეშე

AI და ხელოვნური ხმები რეკლამებსა და სხვა შემოქმედებით კონტენტში სულ უფრო ხშირად შეგვხვდება, თუმცა OpenAI-მ გამოავლინა ზოგიერთი უცნაურობა ChatGPT-40 ტექნოლოგიაში, როგორიცაა ხმის კლონირების და აზრებისა და წინადადებების დასრულების უნარი.

გასულ კვირას OpenAI-მ გამოაქვეყნა ანგარიში, სადაც დეტალურად არის აღწერილი კომპანიის უახლესი დიდი ენობრივი მოდელის, GPT-40-ის „რისკის ძირითადი სფეროები“ და როგორ ცდილობენ მისი მათ შემცირებას.

ტექნოლოგიას ასევე აქვს ხმების იმიტაციის და ხმოვანი ეფექტების გენერირების უნარი,  როგორიცაა ყვირილი და იარაღის გასროლის ხმები. განახლდა ტექსტზე დაფუძნებული ფილტრები მუსიკის შემცველი აუდიოს გაფილტვრის, აღმოჩენისა და დაბლოკვისთვის. ChatGPT-ის გაუმჯობესებული ხმოვანი რეჟიმის შეზღუდულ ალფა ვერსიას შეზღუდული აქვს სიმღერა.

OpenAI-ს მიერ ბლოგ-პოსტში გაზიარებული აუდიო კლიპი აჩვენებს, თუ როგორ შეუძლია ტექნოლოგიას გააგრძელოს წინადადება იმავე ხმით. ეს არის მაგალითი იმისა, თუ როგორ შეუძლიათ რეკლამის დამკვეთებს და შემქმნელებს შეცვალონ კონტენტის მიმართულება თავდაპირველი დიზაინერის ან ავტორის დახმარების გარეშეც კი.

OpenAI-ით ხმის გენერირება შეიძლება მოხდეს ისეთ სიტუაციებში, როგორიცაა ხმების გენერირების უნარი ChatGPT-ის გაუმჯობესებული ხმოვანი რეჟიმისთვის. ტესტირების დროს, OpenAI-მ შენიშნა იშვიათი შემთხვევები, როდესაც მოდელი უნებლიეთ აგენერირებდა მომხმარებლის ხმის ასლს ან იმიტაციას.

OpenAI-ს დეველოპერებმა შეამცირეს ხმის გენერირებასთან დაკავშირებული რისკები იმით, რომ დაუშვეს მხოლოდ წინასწარ განსაზღვრული ხმების გამოყენება, რომლებიც მათ ხმის მსახიობებთან თანამშრომლობით ჩაწერეს. შერჩეული ხმები გამოიყენეს აუდიო მოდელის პოსტ-ტრენინგისთვის. OpenAI აღნიშნავს, რომ უნებლიე ხმის რეპლიკაციის რისკი „მინიმალურია“.

წყარო: mediapost

ობოლი ლტოლვილიდან ოლიმპიელობამდე — მოკლემეტრაჟიანი ფილმი მორბენალის ცხოვრებაზე გვიყვება

Banksy-მ ლონდონის ქუჩები ცხოველთა მურალებით აავსო