Robotika.lt

Geresnė robotų rega: Nurašytas statistikos įrankis gali pagelbėti robotams geriau suprasti objektus ir aplinką

Robotika.lt spalio 31, 2013 Robotai mokslui Robotai pramogai
Objektų atpažinimas yra viena labiausiai studijuojamų kompiuterinės regos problemų. Tačiau robotas norėdamas manipuliuoti objektais privalo ne tik juos atpažinti; jis taip pat turi suvokti jų padėtį. Ar puodelis padėtas gerai, ar jis apverstas aukštyn kojom? Ir į kurią pusę nukreipta jo rankenėlė?

Kad pagerintų robotų gebėjimą suvokti objektų padėtį, Jaredas Gloveris, Masačiusetso Technologijos Instituto Elektros Inžinerijos ir Kompiuterijos Mokslų abiturientas, naudojasi statistine konstrukcija, vadinama Binghamo pasiskirstymu. Teigiama, jog šis naujasis robotinės regos algoritmas yra 15 proc. geresnis nei artimiausi jo konkurentai, atliekant objektų atpažinimo užduotis netvarkingose erdvėse.

Šis algoritmas skirtas analizuoti aukštos kokybės vaizdinei medžiagai pažįstamoje aplinkoje. Kadangi Binghamo pasiskirstymas yra įrankis nustatyti tikėtinumui, ši technologija žada daug naudos, tokiose situacijose, kuomet regima informacija neišsami ir nepatikima. Vis dar besitęsiančiame darbe Gloveris naudoja Binghamo pasiskirstymą, kad išanalizuotų stalo teniso kamuoliukų orientaciją skrydžio metu, norėdamas išmokyti robotus žaisti stalo tenisą. Tokiais atvejais, kuomet vaizdinė informacija yra sąlyginai skurdi, algoritmas pateikia skaičiavimus, kurie daugiau nei 50 proc. atvejų būna teisingi.

„Algoritmai yra raktas į daugybę robotikos problemų, nuo objektų paieškos ir radimo iki kartografavimo,“ – teigė Gloveris. „Dviprasmybės iš tiesų yra kertinis iššūkis, norint sukurti horizantalią projekciją užgriozdintoje aplinkoje, pavyzdžiui, šaldytuve arba stalčiuje. Štai kodėl Binghamo pasiskirstymas atrodo kaip puikus įrankis, nes jis leidžia algoritmui gauti informaciją iš kiekvienos aplinkos detalės.“

Kadangi Binghamo pasiskirstymo statistinė sistema tapo šio darbo pagrindu, Gloveris sukūrė programinę įrangą, kuri smarkiai padidina šios statistikos apskaičiavimo greitį. Ši programinė įranga yra nemokama ir prieinama internetu visiems tyrėjams, norintiems ja naudotis, puslapyje http://code.google.com/p/bingham/

Rotacija

Viena priežasčių, kodėl Binghamo pasiskirstymas toks naudingas robotų regai, tai kad šis metodas leidžia sujungti skirtingų šaltinių informaciją. Norint nustatyti objekto orientaciją pasitelkiamas geometrinio modelio palyginimas, vertinantis visą kameros užfiksuotą vaizdą – šiuo atveju naudojama 3D Microsoft Kinect kamera, kuri kartu su 2-D spalvotu vaizdu išsaugo informaciją apie objektų spalvų nuotolį.

Kad būtų aiškiau, įsivaizduokite, kad kalbame apie tetraedrą – piramidę sudarytą iš keturių kampų ir keturių sienų. Taip pat įsivaizduokite, kad programinė įranga nustatė keturias vietas vaizde, kuriose staiga kinta spalvos ir gylio duomenys – veikiausiai tai bus objekto kampai. Ar tai tetraedras?

Yra du probleminiai aspektai – modelis ir objektas – svarbu išsiaiškinti kaip vieną pritaikyti kitam. Dauguma algoritmų, Gloverio teigimu, iškart ves tiesias linijas nuo vieno kampo iki kito. Tetraedro atveju, tarkime, kad po pirminio sugretinimo, kiekvienas modelio kampas yra arti objekto kampų, tačiau jie nėra tobulai suderinami.

Jeigu abu apibūdinimai atitinka tą patį objektą, tuomet jie gali būti sugretinami, sukant vieną iš jų aplink savo ašį. Bet kuriai kampų porai – vienai iš modelio ir vienai iš objekto – įmanoma apskaičiuoti tikimybę, jog pasukus objekto kampą jis taps suderinamas su modeliu. Problema ta, kad tas pats pasukimas, gali perstumti kitus kampus tolėliau nuo vienas kito.

Gloveris parodė, jog rotacijos galimybės kiekvienam kampų poros sutapimui gali būti apibrėžtos Binghamo pasiskirstymu. Tai leidžia Gloverio ir Popovičiaus algoritmui kruopščiai tyrinėti galimas rotacijas, greitai atrandant tą, kuri tinkamiausia kampų sugretinimui.

Didelis skėtis

Ir tai nėra viskas. Tuo pačiu būdu Binghamo pasiskirstymas gali sujungti kiekvienos kampų poros galimybės į vieną bendrą galimybę, jis taip pat gali tam panaudoti ir kitokiais būdais gaunamą informaciją – pavyzdžiui, vertindamas objekto paviršiaus išlinkimus. Dabartinė Gloverio ir Popovičiaus algoritmo versija remiasi objekto kampų rotacija, kartu su keliais kitais kriterijais.

Eksperimentuose susijusiuose su vaizdine informacija iš dalinai užgriozdintos aplinkos – atsižvelgta į tokią aplinką, su kuria namų robotams teks dažnai susidurti – Gloverio algoritmas veikė taip pat gerai, kaip ir geriausias šiuo metu egzistuojantis konkurentų algoritmas. Maždaug 84 procentai objektų buvo identifikuoti sėkmingai, tuo tarpu šis varžovų algoritmų rodiklis siekė 83. Tačiau Gloverio algoritmas kur kas geriau atpažino objektus užgriozdintose aplinkose (73 procentai prieš 64). Gloveris galvoja, kad taip yra dėl to, jog jo algoritmas geba geriau nustatyti objektų orientaciją.

Jis taip pat mano, jog papildomi informacijos gavimo būdai, padėtų algoritmui veikti dar geriau. Pavyzdžiui, Binghamo pasiskirstymas taip pat galėtų pasitelkti statistinę tam tikrų objektų informaciją – pavyzdžiui, kad kavos puodelis gali būti apverstas, arba padėtas taisyklingai, tačiau jis labai retai kada bus pastatytas skersai.

Gloverio teigimu, vienas didžiausių Binghamo pasiskirstymo privalumų, tai jos lankstumas. „Gali pasitelkti visas savo programavimo žinias mokydamas robotą, kaip rasti stalą, kėdę ar puodelį, tačiau bendros paskirties robotinio pažinimo įrankių nėra daug. Susidūrus su keblesnėmis problemomis, pavyzdžiui, ryšių tarp objekto ir jo savybių nustatymu, mums dar daug kur reikia plėstis. Kol mes to neįstengsime padaryti, tikrai manau, jog robotai bus labai ribotų galimybių.“



Facebook komentarai


Komentarai (0)


Parašykite komentarą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *