„Google Translate-ის დაწერილს ჰგავს“ – ასე მაშინ ვამბობთ, როდესაც თარგმნილი ტექსტი არაბუნებრივად იკითხება. ეს მართლაც წარმოადგენს პრობლემას მათთვის, ვისაც ხშირად აქვს შეხება უცხოენოვან ტექსტებთან და მათ გადმოქართულებას ცდილობს. მცირე რესურსიანი ენების ხარისხიანი თარგმნა ერთ-ერთი ყველაზე დიდი გამოწვევაა. ქართული ენა, სომხურთან და აზერბაიჯანულთან ერთად, სწორედ ამ კატეგორიაში ექცევა. თუმცა, ucraft-ის გუნდმა შექმნა ხელოვნურ ინტელექტზე დაფუძნებული თარგმნის სისტემა translate.ucraft.io, რომელიც ტრადიციული სერვისებისგან განსხვავებით, ენის სპეციფიკასა და კონტექსტს ითვალისწინებს.
AI თარგმნის სერვისი მანამდე მხოლოდ გამომწერებისთვის იყო განკუთვნილი. ახლა კი, ucraft-მა ის ყველასთვის გახადა ხელმისაწვდომი და პირველსავე თვეს, 11,000-ზე მეტმა მომხმარებელმა გამოიყენა. პლატფორმაზე უფასოა თარგმნა ისეთ მცირე რესურსიან ენებზე, როგორიცაა ქართული, სომხური, აზერბაიჯანული, ყაზახური და უზბეკური.
რამდენად ეფექტურია ucraft-ის AI-თარგმნა, როგორ „ასწავლეს“ ხელოვნურ ინტელექტს ქართული და რატომ არის მცირე რესურსიანი ენების ნიშა ბიზნესისთვის საინტერესო, ucraft-ის დამფუძნებელმა არტიომ ანანოვმა გვიამბო.
M: რა გამოწვევის წინაშე არიან ადამიანები, რომლებიც სხვადასხვა ენებიდან ქართულად გადმოთარგმნას ცდილობენ Google Translate-ის მსგავსი ხელსაწყოებით?
პირველ რიგში, ავხსნი, თუ რატომ არის არსებითი გამოწვევა მცირე რესურსიანი ენების, მათ შორის ქართულის თარგმნა. რეალურად, რატომ არის თარგმანის ხარისხი ცუდი? იმიტომ, რომ ქართული, ისევე როგორც სხვა მცირე რესურსიანი ენები, ნაკლებადაა წარმოდგენილი ინტერნეტ სივრცეში. შესაბამისად, Google Translate-ის მსგავს უფასო სერვისებს არ აქვთ საკმარისი მონაცემები სწავლებისთვის, რის გამოც ბევრ გრამატიკულ შეცდომას უშვებენ.
კიდევ ერთი მნიშვნელოვანი პრობლემაა ის, რომ ეს სერვისები ვერ ითვალისწინებენ ქართული ენის სპეციფიკას. მაგალითად, თუ გვაქვს რაღაც რთული წინადადება ინგლისურად თავისი გამონათქვამებით, Google-ი თარგმნის პირდაპირ, ამიტომაცაა შედეგი არასახარბიელო. ვერ ხდება იმ ენობრივი და კულტურული თავისებურებების გათვალისწინება, რაც ქართულ ენას აქვს.
M: რა განასხვავებს თქვენს პლატფორმას არსებული თარგმნის სერვისებისგან გრამატიკული სიზუსტისა და სტილისტიკური ნიუანსების თვალსაზრისით?
ჩვენი თარგმნის სერვისი რამდენიმე მნიშვნელოვანი უპირატესობით გამოირჩევა. პირველ რიგში, გრამატიკული სიზუსტის თვალსაზრისით ჩვენი სისტემა ბევრად უკეთეს შედეგს იძლევა, განსაკუთრებით კომპლექსური წინადადებების თარგმნისას. ეს განპირობებულია იმით, რომ ჩვენი ხელოვნური ინტელექტი არა მხოლოდ სიტყვასიტყვით თარგმნის, არამედ ითვალისწინებს ენის სპეციფიკასა და კონტექსტს.
მნიშვნელოვანია ისიც, რომ მაღალი ხარისხის თარგმანის მისაღებად მომხმარებელს არ სჭირდება ფულის გადახდა, სხვა AI ხელსაწყოებისგან განსხვავებით. ამასთან, სერვისი ტექნიკური თვალსაზრისითაც კომფორტულია გამოსაყენებლად – შესაძლებელია ტექსტის ფორმატირების შენარჩუნება, რაც განსაკუთრებით მნიშვნელოვანია რედაქტორებისა და ტექსტებთან მომუშავე პროფესიონალებისთვის.
M: რატომ არის მცირე რესურსიან ენებზე თარგმნა გამოწვევა და როგორ ახერხებთ ამ პრობლემის გადაჭრას?
მთავარი პრობლემა მცირე რესურსიან ენებთან დაკავშირებით არის ის, რომ ისინი ნაკლებად არიან წარმოდგენილი ინტერნეტ სივრცეში. ეს ეხება როგორც ქართულს, ისე სომხურს, აზერბაიჯანულსა და სხვა ნაკლებად ცნობილ ანუ მცირე რესურსიან ენებს. შესაბამისად, ნებისმიერი ტრადიციული თარგმნის სისტემა, რომელიც ინტერნეტში არსებულ მონაცემებზე სწავლობს, ბევრ გრამატიკულ შეცდომას უშვებს და ვერ უზრუნველყოფს შესაბამისი ხარისხის თარგმანს.
ჩვენ ეს პრობლემა გადავჭერით ხელოვნური ინტელექტის გამოყენებით. ამ მიდგომის წყალობით, თარგმანი ხუთჯერ უკეთესია, გრამატიკული და სტილისტიკური თვალსაზრისით.
ჩვენი სისტემა ითვალისწინებს ენების სპეციფიკას. მაგალითად, თუ გვაქვს რთული ინგლისური ფრაზა თავისი იდიომებით, ხელოვნური ინტელექტი არ აკეთებს პირდაპირ ტრანსლაციას. ის ითვალისწინებს ქართული ენის სპეციფიკას, ტერმინოლოგიას და ახდენს ისეთ თარგმანს, რომელიც გასაგები იქნება მომხმარებლისთვის.
ამ მიდგომის წარმატება დაადასტურა იმანაც, რომ ბოლო თვის განმავლობაში 11,000-ზე მეტი მომხმარებელი გვყავდა, რაც ჩვენთვისაც კი მოულოდნელად წარმატებული შედეგი აღმოჩნდა. ეს აჩვენებს, რომ მომხმარებლებს მართლაც სჭირდებოდათ ხარისხიანი თარგმნის სერვისი მცირე რესურსიან ენებზე.
M: როგორ ხდება ხელოვნური ინტელექტისთვის ისეთი ენების სწავლება, როგორიცაა ქართული, სომხური და აზერბაიჯანული?
ენების სწავლების პროცესში გამოიყენება წინადადებების დაწყვილების მეთოდი. ეს ნიშნავს, რომ სისტემას მიეწოდება, მაგალითად, ინგლისური წინადადება და მისი ხარისხიანი ქართული თარგმანი. ამ პროცესში აქტიურად არიან ჩართული ადამიანები, რომლებიც ხელოვნურ ინტელექტს ასეთ წინადადებების წყვილებს დიდი რაოდენობით აწვდიან.
სისტემა იწყებს პატერნების ამოცნობას. მაგალითად, როდესაც ხედავს მსგავს წინადადებებს, სადაც გარკვეული სიტყვები მეორდება, ის სწავლობს, რომ კონკრეტულ კონტექსტში კონკრეტული სიტყვა უნდა გამოიყენოს. ეს ეხება არა მხოლოდ სიტყვების შერჩევას, არამედ გრამატიკულ და სტილისტიკურ ასპექტებსაც – სისტემა არჩევს, რომელი ფორმა იქნება უფრო სწორი და შესაფერისი მოცემულ სიტუაციაში.
M: რა ენებიდან არის შესაძლებელი თარგმნა ქართულ ენაზე?
ამ ეტაპზე, მოცულია ყველა ძირითადი საერთაშორისო ენა – ინგლისური, ესპანური, გერმანული და ა.შ. განსაკუთრებით საინტერესოა ის, რომ ჩვენი პლატფორმა მუშაობს მცირე რესურსიან ენებზეც, როგორებიცაა ქართული, სომხური, აზერბაიჯანული, ყაზახური და უზბეკური. მომავალში ვგეგმავთ კიდევ უფრო მეტი ენის დამატებას.
პლატფორმაზე არსებობს ენის ავტომატური ამოცნობის ფუნქცია, რაც იმას ნიშნავს, რომ მომხმარებელს არ სჭირდება საწყისი ენის მითითება – სისტემა ავტომატურად ამოიცნობს მას და სასურველ ენაზე გითარგმნით. ამას გარდა, ნებისმიერი ამ ენიდან შესაძლებელია თარგმნა ნებისმიერ სხვა ენაზე, მათ შორის ერთი მცირე რესურსიანი ენიდან მეორეზე, მაგალითად, აზერბაიჯანულიდან ქართულზე.
M: რამდენად საინტერესოა ucraft-ისთვის, როგორც ბიზნესისთვის, თარგმანის უფასო ფუნქციის დამატება პლატფორმაზე?
ვთვლით, რომ ეს მიმართულება არის ძალიან მნიშვნელოვანი რესურსი ბიზნესისთვის და გვსურს მომავალში ამ მიმართულებით განვითარება. თუმცა, გარდა კომერციული მხარისა, ვხედავთ ამ პროექტის სოციალურ მნიშვნელობასაც – ვაკეთებთ კარგ საქმეს საზოგადოებისთვის, რადგან უზრუნველვყოფთ ხარისხიან თარგმნას იმ ადამიანებისთვის, ვისაც არ აქვთ წვდომა ძვირადღირებულ სერვისებზე.
თავიდანვე გვქონდა მოლოდინი, რომ პროდუქტს ექნებოდა კარგი გამოხმაურება მომხმარებლების მხრიდან და ეს მოლოდინი გამართლდა.
საინტერესოა მონეტიზაციის თვალსაზრისითაც. სამომავლოდ, ჩვენი მიზანია, სხვადასხვა კომპანიების რეკლამის ინტეგრირება. ეს იქნება არა აგრესიული რეკლამა, არამედ ჩვეულებრივი ბანერები, რაც არ იქნება გამაღიზიანებელი მომხმარებლისთვის.
M: როგორ ფიქრობთ თარგმანის ფუნქციის დახვეწას?
დავამატებთ ფუნქციონალს, რომლის დახმარებითაც მომხმარებლებს შეეძლებათ ატვირთონ ნებისმიერი ტიპის დოკუმენტი, ვთქვათ, ინგლისურ ენაზე, მიუთითონ ქართული ან ნებისმიერი სხვა ენა და მიიღონ უკვე კონვერტირებული დოკუმენტი, სასურველ ენაზე, იმავე ფორმით, რა ფორმითაც თავდაპირველად იყო ატვირთული. ეს განსაკუთრებით მნიშვნელოვანი ფუნქციონალი იქნება რედაქტორებისა და ტექსტებთან მომუშავე პროფესიონალებისთვის, რადგან სისტემა შეინარჩუნებს დოკუმენტის საწყის ფორმატს. ეს ნიშნავს, რომ თქვენ გადმოგეცემათ დოკუმენტი იმავე სტრუქტურითა და ფორმატით, რაც ჰქონდა ორიგინალს.
M: ucraft-ის გარდა, სხვა პროექტებზეც მუშაობთ…
ამჟამად, რამდენიმე საინტერესო პროექტს ვქმნით. პირველია „რეპეტიტორი“ – საგანმანათლებლო პლატფორმა აბიტურიენტებისთვის, სადაც თავმოყრილია ეროვნული გამოცდების საგნების თეორიული მასალა. ხელოვნური ინტელექტი აანალიზებს მოსწავლის ტესტების შედეგებს, გაუმჯობესების გზებს სთავაზობს და დამატებით სავარჯიშოებს ქმნის, საჭიროების მიხედვით. მოსწავლეს ასევე შეუძლია ჩატში მიიღოს პასუხები კონკრეტულ კითხვებზე.
მეორე AI პროექტი მომხმარებელს საშუალებას აძლევს ვირტუალურად მოიზომოს ტანსაცმელი – ტვირთავ სურათს და სისტემა გიჩვენებს, როგორ მოგერგება. ვმუშაობთ ამ ფუნქციის სხვა პლატფორმებზე ინტეგრირებაზე. ამ მხრივ, საინტერესო იქნება ბიზნესებთან თანამშრომლობა, რაც მნიშვნელოვნად გაზრდის და გაამარტივებს ონლაინ გაყიდვებს – მომხმარებელი უფრო თავდაჯერებულად შეიძენს ტანსაცმელს იქომერსით.