Robot, który uczy się z YouTube’a

Naukowcy coraz lepiej opanowują techniki programowania sztucznej inteligencji. Dzięki analizie wizualnej przepisów na YouTubie potrafią nauczyć robota gotować.

Chociaż pod obudową robota tkwi superszybki procesor, nie tak łatwo nauczyć go gotować z gotowych przepisów; człowiek zrozumie zdanie „potrzebujesz kubka”, maszyna będzie miała z nim problem. W jej języku to polecenie trzeba rozłożyć na cały szereg mniejszych czynności: odwróć się, podejdź do szafki, otwórz ją, zamknij szafkę, odwróć się, wróć do stołu, przesuń kubek tuż ponad blat i w końcu upuść kubek.

Trzeba też nauczyć maszynę, że z kulinarnego punktu widzenia nie ma znaczenia, czy weźmiemy dużą filiżankę, szklankę, plastikowy czy ceramiczny kubek. Liczy się wyłącznie rozmiar naczynia.

Uczeni z Institute for Advanced Computer Studies na Uniwersytecie Maryland postanowili wykorzystać YouTube’a, by nauczyć komputer wszystkich niuansów sztuki gotowania i sprawdzić, w jaki sposób można nauczyć maszynę interpretowania rzeczywistości. W tym celu skonstruowali robota, który oglądając poradniki kulinarne zamieszczone w sieci analizuje wszystkie ruchy i czynności wykonywane przez człowieka w procesie gotowania.

Wybraliśmy poradniki kulinarne, gdyż mnóstwo osób nagrywa takie treści – zauważył Yiannis Aloimonos, profesor Computer Vision Lab z Institute for Advanced Computer Studies na Uniwersytecie Maryland. Gotowanie jest czynnością kompleksową z punktu widzenia manipulowania obiektami, uczy systematyki oraz używania narzędzi. Jeśli na przykład musisz pokroić ogórka, potrzebujesz wziąć do ręki nóż, przesunąć go w odpowiednie miejsce, wykonać cięcie i sprawdzić, czy działanie przebiegło właściwie.

Robot wykorzystuje kilka systemów, które pomagają mu zrozumieć filmy z YouTube’a. Podstawowym narzędziem są kamery z dwoma systemami rozpoznawania obrazu, które pozwalają robotowi śledzić przebieg jego działań. Do tego dochodzi system sztucznej inteligencji analizujący wszystkie informacje oraz system rozpoznawania mowy, który umożliwia zrozumienie poleceń osób przygotowujących potrawy.

Dzięki temu wszystkiemu robot może przeanalizować filmy, przetworzyć je na własną ścieżkę poleceń i nauczyć się nowych, nieznanych do tej pory czynności.

Chcielibyśmy stworzyć technologię, która pozwalałaby robotowi wchodzić w interakcję z człowiekiem – powiedziała Cornelia Fermüller jeden z członków projektu. Aby to zrobić, musimy stworzyć takie narzędzia, dzięki którym maszyna będzie w stanie naśladować poczynania człowieka i śledzić jego działanie w czasie rzeczywistym. Chcemy zrozumieć, w jaki sposób ludzie wykonują poszczególne czynności, jak są przez nich postrzegane i jakie procesy myślowe zachodzą w trakcie ich wykonywania.

Liczy się cel, a nie środki

Tym, co różni zespół z Maryland od innych grup pracujących nad sztuczną inteligencją, jest – jak sami podkreślają – chęć skupienia się na rezultacie, a nie na krokach do jego wykonania. Ich robot powinien wykorzystać swoje doświadczenie do rysowania obrazów, a nie mechanicznie powtarzać wcześniej zaplanowane akcje.

Już teraz widać efekty działań zespołu badawczego. Moduł rozpoznawania chwytu może pochwalić się precyzją na poziomie 77% i zbliżoną powtarzalnością na poziomie 76%. System rozpoznawania obiektów działa jeszcze lepiej: robot poprawnie rozpoznaje 93% narzędzi przy powtarzalności rzędu 93%. Ogólny wynik modułu rozpoznawania obrazu osiągnął wynik na poziomie 79%, co wiąże się z problemami z rozpoznawaniem niektórych potraw, np. tofu. System chwytu ma skuteczność na poziomie 91% a system przewidywania czynności na poziomie 83%.

Aby stworzyć uniwersalnego robota, musimy wejść w kolejną fazę automatyzacji, która doprowadzi do kolejnej rewolucji przemysłowej – podkreśla Aloimonos. Stworzymy inteligentne systemy przemysłowe i w całości zautomatyzowane fabryki. Doskonałym pomysłem będzie wykorzystanie maszyn do zautomatyzowanego wykonywania niebezpiecznych czynności: rozbrajania bomb czy naprawiania szkód po katastrofach atomowych takich, jak miała miejsce w Fukushimie. Udowodniliśmy, że humanoidalny robot może z powodzeniem naśladować to, co robi człowiek.

Choć projekt wygląda naprawdę imponująco, trzeba uważać, by nie wymknął się spod kontroli. Gdyby robot został obdarzony szczątkową inteligencją podobną do Mario A.I. i naoglądał się filmów na YouTubie, na których człowiek niszczy maszyny, mógłby wystąpić przeciw swoim twórcom.

Źródło

żadnych reklam, sama wiedza.

Zarejestruj się na BEZPŁATNY NEWSLETTER i raz w tygodniu otrzymuj najważniejsze wiadmości
ze świata IT, nowych technologii i kryptowalut.

Bez reklam.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *