18
Nov
2019

„მანქანურმა ხედვამ“ სიბნელეში და კედლის მიღმა დანახვა ისწავლა

18 Nov 2019

veon
veon


ახალ „მანქანურ ხედვას“ შეუძლია დაინახოს ის, რაც ადამიანის თვალისთვის შეუძლებელია. მას შეუძლია კედლის მიღმა ობიექტების მოძრაობის იდენტიფიცირება. იგივე ხდება სრულ სიბნელეშიც. ამისათვის, სისტემა რადიოტალღებს იყენებს.

მანქანური ხედვა ტექნოლოგიაა, რომელსაც, გამოსახულებაზე დაყრდნობით, ანალიზისთვის იყენებენ. მაგალითად, ამ მეთოდს იყენებენ რობოტებში, მათი ეფექტური ავტომატური მოქმედების უზრუნველსაყოფად. ამ ტექნოლოგიას აქვს ადამიანების ამოცნობისა და ობიექტების დაფიქსირების ფუნქცია. გარდა ამისა, ის აფიქსირებს სხვადასხვა მოძრაობასა და მოქმედებას. რა თქმა უნდა, ჯერჯერობით, ისეთი სიზუსტით ვერა, როგორითაც ადამიანი, თუმცა, ზემოთაღნიშნული სიახლე ამას თითქოს აბალანსებს კიდეც.

მანქანური ხედვის ლიმიტი ასეთია, ან აქამდე, ასეთი იყო – მას სჭირდებოდა დიდი დრო ადამიანის ამოსაცნობად და ესეც რომ არა, თუ ოთახში კარგი განათება არ იყო, ტექნოლოგია „ბრმავდებოდა“. მკვლევარებმა გამოსავალი ელექტრომაგნიტურ სპექტრში იპოვეს, რომელიც მსგავსად შეზღუდული არაა. ჩვენი სამყარო სავსეა რადიოტალღებით, მიუხედავად იმისა, დღეა, თუ ღამე. სინათლისგან განსხვავებით, რადიოტალღები მარტივად მოძრაობენ კედლების გავლით და ისინი ჩვენს სხეულებშიც გადიან.

რადიოხედვას ხარვეზებიც აქვს. მაგალითად, ასეთი გამოსახულების რეზოლუცია დაბალია, გამოსახულებები სავსეა სხვადასხვა ობიექტებით, რომლებიც შესაძლოა, იკვეთებოდნენ კიდეც. რაც კედლის მიღმა, თუ სიბნელეში მიმდინარე პროცესის აღქმას აფერხებს. მოკლედ რომ ვთქვათ, აქამდე არსებულ მანქანურ ხედვასა და ახალს – ორივეს აქვს დადებითი და უარყოფითი მხარეები. თუმცა, მასაჩუსეტსის ტექნოლოგიური ინსტიტუტის მკვლევარმა ტიანჰონგ ლიმ, კოლეგებთან ერთად, იპოვა მანქანური ხედვისთვის რადიოხედვის სწავლების გზა. ეს კარგ განათებაში გადაღებული გამოსახულებებით ტექნოლოგიის გაწვრთნით გახდა შესაძლებელი. მთავარი მიდგომა ორივე პირობაში, იდენტური სიტუაციების ვიდეოგადაღება იყო. ერთ შემთხვევაში, მოქმედებას იღებდნენ კარგი განათების პირობებში, მეორე შემთხვევაში კი, იდენტური სცენის აღქმას რადიოტალღების დახმარებით ცდილობდნენ. თუმცა, სირთულეს წარმოადგენდა იმის განსაზღვრა, რომ სწავლების პროცესში, მანქანური ხედვა ადამიანის მოქმედებაზე ყოფილიყო ორიენტირებული და არა სხვა ნივთებზე, მაგალითად, ადამიანის უკან მდგარ მაგიდაზე. ამდენად, ლიმ, კოლეგებთან ერთად შეიმუშავა ახალი მიდგომა, რომლის მიხედვითაც, მანქანას 3D, ჯოხისებური მოდელების გენერირება შეუძლია.

„გამოსახულების თარგმნისა და მისი ადამიანის ჩონჩხზე დაფუძნებული რეპრეზენტაციის წყალობით, ჩვენი მოდელი შეძლებს შეიმეცნოს გარემო, როგორც მხედველობაზე დაფუძნებული, ასევე, რადიოსიხშირეზე დაყრდნობილი მონაცემების მიხედვით. ეს ორი ფუნქცია ერთმანეთის დამხმარე იქნება. ვაჩვენეთ, რომ ჩვენი მოდელი მაღალი აკურატულობით მუშაობს მხედველობაზე დამოკიდებული მოქმედების ამოცნობის სისტემის მხრივ და ვაგრძელებთ მუშაობას, იმისათვის, რომ მან დაინახოს ის, რისი დანახვაც ადამიანს არ შეუძლია “, – ამბობს ტიანჰონგ ლი, MIT Technology Review-სთან საუბრისას.

აღსანიშნავია, რომ ერთ-ერთი შეზღუდვა, რაც მანქანური ხედვის მხედველობაზე დაყრდნობილ ნაწილს აქვს, ადამიანის იდენტიფიცირებადობაა. მას შეუძლია ამოიცნოს ადამიანი, რაც აჩენს პერსონალურ ინფორმაციასთან დაკავშირებულ კითხვებს. რადიოსისტემას, რა თქმა უნდა, არ ექნება სახის ამოცნობის ტექნოლოგია. ქმედების იდენტიფიცირება, სახის ამოცნობის გარეშე, პერსონალური ინფორმაციის დაუცველობასთან დაკავშირებულ შიშებს აქარწყლებს. მსგავსმა მიღწევამ კი, შესაძლოა, ჭკვიანი სახლის სისტემებში ამ ტექნოლოგიის დანერგვაზე საუბარი დააჩქაროს. ლის თქმით, ტექნოლოგია შეიძლება გამოყენებულ იქნას, მაგალითად, მოხუცებზე ზრუნვის მიმართულებით. მაგალითად, იმ შემთხვევაში, თუ ისინი სახლში წაიქცევიან, რეაგირება სწრაფი იქნება.

განხილვა