Potrebujete pre svoj vývoj AI hlasové nahrávky? Žiaden problém!

Spoločnosť Mozilla prišla s projektom Common Voice, ktorého cieľom je nadobudnúť veľké množstvo hlasových nahrávok pre potreby vývoja umelej inteligencie. Do nahrávania sa môže zapojiť každý nahraním hlasu. Dostupných je zatiaľ 37 jazykov a ich počet sa stále zvyšuje. Pripravujú sa napríklad aj slovenčina a čeština, v ktorých však zatiaľ nie je možné nahrávať.

Cieľom Mozilly je vylepšiť technológiu na rozpoznávanie reči pre ich stroje z projektu s názvom Deep Speech a naučiť stroje rozprávať čo najpodobnejšie ľuďom, no na to je potrebné veľké množstvo hlasových údajov. Je založený na prispievaní nahrávok od obyčajných ľudí – dobrovoľníkov. Nahrávanie hlasových údajov pre projekt Common Voice je veľmi jednoduché. Stačí Vám vytvoriť si účet na stránke Voice Mozilla, kde nahráte svoj hlas pri čítaní predpísaných viet. Okrem nahrávania  je takisto možné aj validovať nahrávky ostatných dobrovoľníkov.

zdroj: CSTRSK, Pixabay

Projekt Common Voice nie je však len o prispievaní svojím hlasom a kontrolovaní ostatných. Mozilla sprístupnila všetky nahrávky pre verejnosť, ak Vás teda táto technológia zaujíma, môžete si ich jednoducho stiahnuť vo formáte MP3. Momentálne je k dispozícii viac ako 2 400 hodín nahrávok hlasu. K nahrávkam je k dispozícií aj špecifikácia hovoriaceho, ako je vek a pohlavie, s ktorými sa dá ďalej pracovať na Vaše účely.

Nahrávky sú veľmi rôznorodé, sú tu vekové kategórie od teenagerov po seniorov, ľudia rôznych národností, prízvukov a jazykov.  Ich počet sa neustále zvyšuje a tak pomáha vylepšovať tvorbu rôznych aplikácií a technológií. Výborná vec na Common Voice je, že sa nebráni žiadnemu jazyku, sprístupní každý, na ktorom budú dobrovoľníci pracovať a vytvárať nahrávky. Vy, ktorým nerobia problém cudzie jazyky, to môžete vyskúšať hneď, ale ak máte záujem o slovenčinu, musíte si ešte nejaký čas počkať.

zdroj :

https://blog.mozilla.org/blog/2019/02/28/sharing-our-common-voices-mozilla-releases-the-largest-to-date-public-domain-transcribed-voice-dataset/

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *