22
Jul
2019

ხელოვნურ ინტელექტს უძველესი, მკვდარი ენების თარგმნა შეუძლია

22 Jul 2019

ამჟამად, დედამიწაზე 6500-დან 7000-მდე ენაზე ვსაუბრობთ, მაგრამ ეს იმის მეოთხედია, რაც ისტორიულად არსებულა. საერთო ჯამში, ლინგვისტურ ვარაუდს თუ დავეყრდნობით, კაცობრიობა, მისი არსებობის განმავლობაში, 31 000 ენაზე საუბრობდა. დროთა განმავლობაში, ბევრი ენა დაიკარგა, მისი ჟღერადობა, პოეზია თუ კულტურა, რომელსაც ის გამოხატავდა – მასთან ერთად, დავიწყებას მიეცა. თუმცა, თანამედროვე ტექნოლოგიები გვაძლევს შანსს წავიკითხოთ მკვდარ ენებზე დაწერილი ტექსტები. MIT-ისა (მასაჩუსეტსის ტექნოლოგიების ინსტიტუტი) და Google-ის მკვლევარებმა უძველესი ენების სათარგმნელად ხელოვნური ინტელექტი გამოიყენეს. ტექნიკის გამოყენება ისეთი ენების სათარგმნადაც შეიძლება, რომლებიც დიდი ხანია მკვდარი ენების რიცხვს მიეკუთვნება და რომელთა გაშიფვრაც, ჯერჯერობით, ვერც ერთმა მეცნიერმა შეძლო.

იმის მიუხედავად, რომ ენა იცვლება, ან ქრება, მნიშვნელოვნად ბევრი სიმბოლო, სიტყვებისა და ასოების წყობა, დროის გასვლის მიუხედავად, მსგავსი რჩება. სწორედ ამის გამოა, რომ შესაძლებელი ხდება დიდი ხნის წინ დაკარგული ენის გაშიფვრა. ამ ინსაითის გარშემო გაერთიანდნენ MIT-ის მეცნიერები – ჯიამინგ ლუო და რეჯინა ბარზილეი, მეორე მხრივ კი იუან ცაო Google-ის ხელოვნური ინტელექტის ლაბორატორიიდან. მათ გამოიყენეს მანქანური სწავლება, იმისათვის, რომ გაეშიფრათ ძველი წელთაღრიცხვით 1400 წლის, ადრეული ბერძნული ენა (Linear B) და ადრეული ებრაული (უგარიტული) ენა, რომელიც 3000 წლისაა.

Linear B აქამდე, 1953 წელს იყო ნაკვლევი და ის მეცნიერმა მაიკლ ვენტრისმა გაშიფრა. თუმცა, ეს იყო პირველი შემთხვევა, როცა ხელოვნურ ინტელექტს უნდა ექნა იგივე. პროექტში ჩათული მეცნიერების მიდგომა ითვალისწინებდა ოთხ ძირითად თვისებას (distributional similarity, monotonic character mapping, structural sparsity and significant cognate overlap), იმ კონტექსტიდან და სიმბოლოებიდან გამომდინარე, რომელიც ხელოვნურ ინტელექტს უნდა გაეშიფრა. გაწვრთნის შემდეგ, ხელოვნურმა ინტელექტმა Linear B-სა და თანამედროვე ბერძნულს შორის არსებული კოგნატების (მონათესავე სიტყვების) 67.3% ამოიცნო.

როგორც ორგანიზაციების მიერ გამოქვეყნებულ ანგარიშში ვკითხულობთ, რისი გაკეთებაც ხელოვნურ ინტელექტს უკეთ შეუძლია, არის მდგრადი და უხეში მიდგომა, რომელიც ადამიანური გონებისთვის საკმაოდ დამღლელი იქნებოდა. მას შეუძლია თარგმნოს ათასწლეულების წინანდელი ანბანის სიმბოლოები, მისი სხვა ანბანებთან სწრაფი შედარების გზით. ამ პროცესში კი ხელოვნური ინტელექტი გამოიყენებს იმ ცოდნას, რაც კი ამ ეტაპზე, კაცობრიობას, უძველესი ენების შესახებ აქვს.

მეცნიერების შემდეგი გეგმა Linear A  არის – უძველესი ბერძნული ენა, რომელიც ძველი წელთაღრიცხვის 1800 წლიდან 1450-მდე არსებობდა. მისი გაშიფვრა კი, ჯერჯერობით, ვერც ერთმა მეცნიერმა შეძლო. შეძლებს თუ არა ხელოვნური ინტელექტი ამ გამოწვევის დაძლევას – ამას, ალბათ, უახლოეს მომავალში გავიგებთ. მანამდე კი, Linear B-სთან დაკავშირებული კვლევის ანგარიშს სრულად, შემდეგ ბმულზე შეგიძლიათ გაეცნოთ.

განხილვა