Efektívnejšie trénovanie umelej inteligencie
Úvodný obrázok zdroj: Laci Molnár, Pixabay
Trénovanie umelej inteligencie je často dôležitý prvok pri jej samotnom vývoji. Prvé experimenty s umelou inteligenciou siahajú vyše pol storočia dozadu. Od vtedy sme sa dostali k jej podobe vo forme navrhovaného „playlist-u“, Watson platforme či robotom ako Sofia. Plán spoločností, ktoré ich vyvíjajú, je spraviť z nich napr. plnohodnotných spoločníkov (zatiaľ spĺňajú hlavne rozkazy). Najnovšie sa dokonca okrem manipulácie s ťažkými predmetmi rozmýšľa o ich využití pri presunoch imobilných ľudí. Zveriť ľudské telo umelej bytosti však bude možné až po dokonalom natrénovaní chytenia telesa.
Chyť ma, ak to dokážeš
Naučiť OpenAI robota skladať Rubikovu kocku nebol až taký problém ako ho naučiť samotné chytenie kocky. Keby sme to mali vyjadriť v rokoch, toto učenie ľudského úchopu predstavovalo tréning počas 10 000 ľudských rokov.
Zdroj: OpenClipart-Vectors, Pixabay
Tvrdenie “zmysel spočíva v detailoch” platí aj v tomto prípade. Naučiť potlačiť škatuľu a vziať ju do ruky sú dve odlišné veci. Človek pri dvíhaní nového predmetu použije aj intuíciu. Skúsi odhadnúť váhu a pri vyššej váhe uchopí predmet inak. Tento proces výučby trvá u robotov pochopiteľne dlhšie a nedá sa aplikovať „pravidlo“, ktorý úchyt použiť pri ktorom telese.
Prístup human in the loop
V novej štúdii predstavili na Univerzite v Južnej Karolíne prístup založený na tzv. nepriateľskej hre. Prirovnávajú ho k príkladu v tenise. Ak vás protivník nechá vždy vyhrať, v hre sa nebudete zlepšovať, lebo nemáte dôvod. Pri úspešnom uchytení predmetu tak aplikovali prístup „human in the loop“, kedy do procesu zasahuje človek. Namiesto toho, aby robota „prehovárali“ o existencii efektívnejšieho úchopu, ho robot musel uchopiť znova. Človek predmet odtiahol nenásilným spôsobom. Aby umelá inteligencia nezlyhala a o predmet neprišla, učila sa z rôznych úchopov a bola čoraz úspešnejšia pri jeho udržaní.
V tom sa líši od priemyselného robota, ktorého úlohou je natrénovať iba nízky počet opakujúcich sa úloh.
Zdroj: kalhh, Pixabay
Spomínaný nápad vznikol na základe pozorovania japonského robota, ktorý bol v obchodnom centre vystavený nepriateľskému správaniu detí. Vedeckému tímu teda napadlo využiť pri trénovaní umelej inteligencie interakciu s ľuďmi. Výsledky potvrdili príklad z tenisu. Úspešnosť umelej inteligencie v prípade interakcie človeka ako protivníka bola 52 %, pri úlohe človeka ako spolupracovníka dosiahla úspešnosť iba 26,5 %.
Spolupracovník z tímu Stefanos Nikolaidis verí, že by sa tento prístup interakcie s človekom v úlohe “protivníka” mohol uplatniť ako základ nového učenia umelej inteligencie. Ide o najpodstatnejší krok v procese, ktorý má do nášho života túto novú technológiu začleniť. Aj malá odchýlka môže smerovať trénovanie umelej inteligencie neželaným smerom.