როგორც ჩანს, გუგლმა ახალი გზა იპოვა იმის საჩვენებლად, თუ რისი გაკეთება შეუძლია Gemini AI-ის მოდელს. ამაში არც მეტი, არც ნაკლები რობოტი დაიხმარა — კომპანიის Everybody Robots Division-ის ნაწილია, რომელიც მართალია, გასულ წელს დაიხურა, მაგრამ აშკარაა, რომ ისინი კვლავ ჩვენ ირგვლივ არიან… ამგვარად, გუგლმაც ერთ-ერთ მათგანს ყვითელი ბანტი შეაბა და შემდგომ Gemini გამოიყენა, რათა რობოტისთვის ესწავლებინა, როგორ ეპასუხა ბრძანებებზე და შესძლებოდა ნავიგაცია DeepMind-ის საოფისე სივრცეში.
ამის მისაღწევად გუგლმა ე. წ. ხედვის ენობრივი მოდელები VLM-ები გამოიყენა, რომლებიც სურათებსა და ვიდეოებზე იწვრთნება, ტექსტთან ერთად, რაც მათ საშუალებას აძლევს, უპასუხონ კითხვებს და შეასრულონ ამოცანები, რომლებიც სიზუსტეს მოითხოვს.
მაგალითისთვის, ერთ-ერთ ვიდეოში გუგლის თანამშრომელი რობოტს სთხოვს, სადმე წაიყვანოს რაღაცების დასახატად. რობოტი ეუბნება, რომ ერთი წუთი სჭირდება ფიქრისთვის, შემდგომ კი თანამშრომელი თეთრ დაფასთან მიჰყავს. არსებობს კადრებიც, რომლებშიც ვხედავთ, თუ როგორ აძლევენ რობოტს მითითებებს, მიჰყვეს კონკრეტულ მიმართულებებს თეთრი დაფისკენ, სადაც რუკა აჩვენებს მიმართულებებს იმ სივრცემდე მისასვლელად, რასაც Blue Area-ს უწოდებენ. რობოტი მიჰყვება ამ მიმართულებებს და შემდეგ აცხადებს: „მე წარმატებით მივყევი თეთრი დაფის მიმართულებებს“:
უდავოდ, ეს ექსპერიმენტი მშვენიერ ხედვას გვიზიარებს იმისა, თუ როგორი შეიძლება იყოს AI-ით გაძლიერებული რობოტების მომავალი ჩვენს სახლებში, საწარმოებსა თუ ოფისებში…