Umelá inteligencia analyzuje internetovú premávku

Pracovali ste už na vývoji umelej inteligencie s obsiahlym datasetom? To, aký si vybrať, ak neviete ako na to, sme spomínali v našom článku.

Spracovávali ste 5000 obrázkov či viac ako 100 000 dát a povedali ste si, že wau? Inštitútu MIT sa podaril zaujímavý kúsok, pri ktorom použil dataset s 50 miliardami paketov pochádzajúcich od užívateľov, aplikácií a služieb. Ak prepočítavate, áno, potrebovali na to enormné množstvo procesorov a úložného miesta. Na to im poslúžil ich super-výkonný počítač, ktorý sídli v Lincolnovom laboratóriu MIT.

Operácie na tomto gigantickom datasete zamestnali vyše 10 000 procesorov v laboratóriu a samotnom Inštitúte s cieľom vytvoriť nástroj na sledovanie vzájomných vzťahov dát z internetovej premávky.

procesor

Zdroj: Gerd Altmann upravené, Pixabay

Model

Model pozostáva z neurónovej siete, ktorý bol natrénovaný na sledovanie vzájomných vzťahov medzi jednotlivými paketmi v datasete. Okrem iného môže byť výstupom odhalenie možnej hrozby. Pre jej identifikáciu je ale potrebné disponovať znalosťami ako vyzerá bežná premávka.

Pri trénovaní zistili, že mnoho údajov je prázdnych a výsledky by boli nepresné. Klasické modely, ktoré sa používajú, takéto dáta neberú do úvahy a znižovali aj dôraz na dáta z neznámych stránok.

MIT však matematickými úpravami a trénovaním pokus-omyl dosiahol presný model, ktorý berie do úvahy aj dáta z neznámych stránok. Prečo? Zistili, že majú vplyv na premávku, aj v prípade, že je tento dopad malý. Výsledný model je jednoduchý a obsahuje len dva parametre. V čom je ale výnimočný, keď súčasné modely už sú schopné sledovať hrozbu kybernetických útokov?

pakety; model; neuronova siet

Zdroj: Gerd Altmann, Pixabay

Kvantita

Existujúce modely sú schopné pracovať s malým množstvom paketov, a tak sa znižuje ich presnosť. Zameranie sa na takýto obrovský počet dát, ktorému sa venuje spomínaný model MIT, mu prináša využitie nie len pre sledovanie a ochranu proti kybernetickým útokom.

Vedci teraz hľadajú a posúvajú možnosti tohto modelu. Mohol by identifikovať vzťahy aj v jednotlivých častiach samotnej internetovej siete ako sú napr. sociálne siete. Ako sa vyjadril pracovník Lincolnovho laboratória Jeremy Kepner, „vznikol jedinečný nástroj pre ľudí, ktorí chcú vytvoriť robustné siete alebo identifikovať odchýlky v týchto sieťach.“

Prínos sa očakáva aj vo vypátraní nebezpečných IP adries, nazretie ako funguje prenos a zdieľanie súborov prostredníctvom „peer to peer“, ako aj určenie kritických miest, kde by zvýšenie výkonu pomohlo plynulejšiemu toku dát.

 

Zdroj:

http://news.mit.edu/2019/supercomputer-analyzes-web-traffic-across-entire-internet-1028

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *