Počítačové videnie v kocke I. – Úloha klasifikácie

Vo všeobecnosti, kedykoľvek, keď počítač spracúva vizuálny vstup, ako je napríklad fotka, video, či živý záznam z kamery na našom smartfóne, používa pritom počítačové videnie. Počítačové videnie používa práve na to, aby pochopil a vyhodnotil čo “vidí”. Počítačové videnie si teda môžeme zjednodušene predstaviť ako časť ľudského mozgu, ktorý spracúva informácie prijaté očami.

Počítačové videnie je to, čo napríklad umožňuje, aby skener čiarových kódov vedel “prečítať” zhluk čiar a previesť ho na sekvenciu čísel. Takisto aj keď Face ID od Apple dokáže rozpoznať, či tvár hľadiaca do kamery je vaša. Jeho aplikácie však nájdeme napríklad aj v autonómnych vozidlách, kde sa používa na sledovanie jazdných pruhov či okoloidúcich vozidiel.

zdroj: Nick Hortovanyi, Advanced Lane Detection

Pre statický obraz (obrázok, fotka) najčastejšie riešime konkrétne úlohy ako je klasifikácia, lokalizácia, detekcia objektov či segmentácia obrazu, ale aj rekonštrukcia chýbajúcich dát, farbenie obrázkov či transformácia štýlov. Pre obrazovú sekvenciu (videozáznam) je to napríklad detekcia pohyblivých objektov či trasovanie.

Jedna z najzaujímavejších použití počítačového videnia z hľadiska umelej inteligencie je rozpoznávanie obrazu, ktoré dodáva zariadeniu schopnosť analyzovať a interpretovať prijatý vstup. Do tejto kategórie patria práve spomenuté úlohy klasifikácia, detekcia a segmentácia.

Klasifikácia

O čo presne ide v daných úlohách je znázornené na nasledujúcom obrázku. Prvou z nich je klasifikácia, kde cieľom je priradiť danému vstupnému obrázku označenie – triedu, t.j. aký objekt sa na ňom nachádza. Obrázok je skúmaný ako celok a jediným výstupom má byť to, do akej triedy patrí, prípadne ešte pravdepodobnosť, s akou si je algoritmus istý, že obrázok patrí práve do tejto triedy. Najčastejšie sa tento problém rieši cez konvolučné neurónové siete. Tie v súčasnosti dosahujú skutočne nadpriemerné výsledky, dokonca s vyššou presnosťou, akú dokáže dosiahnuť človek. Vieme na to však použiť aj iné algoritmy, ako napríklad metódou podporných vektorov.

zdroj: Pixabay.com, upravené

 

 

Zdroje:

https://thenextweb.com/artificial-intelligence/2018/07/18/a-beginners-guide-to-ai-computer-vision-and-image-recognition/

http://www.siliconmentor.com/road-and-lane-detection-different-scenarios-and-models/

https://machinelearningmastery.com/applications-of-deep-learning-for-computer-vision/

https://medium.com/analytics-vidhya/introduction-to-image-caption-generation-using-the-avengers-infinity-war-characters-6f14df09dbe5

https://chaosmail.github.io/deeplearning/2016/10/22/intro-to-deep-learning-for-computer-vision/

https://medium.freecodecamp.org/building-an-image-caption-generator-with-deep-learning-in-tensorflow-a142722e9b1f

 

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená.