Machine keel: kuidas Siri teie hääle?
Makradar Tehnikaülikool / / December 19, 2019
Google, Apple, Microsoft ja isegi Amazon on aktiivselt arendada oma häält teenuseid. Värskelt küpsetatud iOS 7 on sama Siri, ainult uusi funktsioone ja... hääl. Kas te ei tea, kuidas see protsess? Kuna arvutid on õpetanud kõnes? see tõeline kunst.
Iga hääled Siri - oma näitleja. Kui ta on lõpetanud oma rolli sõnastamise, töö on alles alanud... Mehe hääl jätkab reisi. Lugu selle reisi, nii mees ja robot - üks kõige keerulisemaid tehnoloogilisi protsesse, mida ei saa läbi kümme aastat tagasi.
Olgem tutvuda direktor disain ja arendamine hääl Nuance, see on üks suurimaid sõltumatuid ettevõtteid maailmas tegelevad kõnetuvastus ja kõnesüntees. Brant Ward (J. Brant Ward), mida kasutatakse olla helilooja, komponeerida poole keelpillikvartetti, et süntesaatoreid ja nüüd ta komponeerib seda kasutades sünteetilisi hääli. Ta töötab kõnesünteesi tööstuse Silicon Valley üle kümne aasta.
Tekst kõneks - väga konkurentsivõimeline tööstus, ja selle töötajad on väga saladuslik. Kuigi maailma ja usub, et Nuance loob hääl Siri jaoks, Ward ja tema kolleegi David Vasquez (David Vazquez) vältida otsest vastust. Kuid nad nõustusid, et selgitada, vähemalt üldiselt, kuidas loomise protsessi hämmastav masin häält.
Ütlematagi selge, et see ei ole vajalik väljendada ja salvestada iga sõna sõnastikus. Aga kui tegemist on taotlus, mis tuleb lugeda kõiki uudiseid oma uudiskirja, või leida midagi sa internetis, see on lihtsalt sunnitud rääkima iga sõna sõnastikus.
Enamik ettepanekuid selekteeritakse "rikkuse foneetika" - mis on, need sisaldavad palju erinevaid kombinatsioone häälikuid. "Fakt on, seda rohkem andmeid meil on, seda rohkem realistlik tulemus on," - ütleb Ward.
Pärast teksti salvestatud live hääl näitleja (tüütu protsess, mis võib kesta mitu kuud), väga raske töö algab. Sõnu ja lauseid analüüsitakse, jagatud kategooriatesse ja salvestatud suur andmebaas. Selles keerulises seotud töö pühendunud keeleteadlased, samuti kasutada oma keelelisi tarkvara.
Kui kõik see on tehtud, ühik Nuance tõlkida teksti kõneks loob natuke sõnu ja väljendeid, et näitleja võib Ma ei ole kunagi tegelikult hääldamine, kuid see kõlab väga sarnane kõne näitleja, sest tehniliselt on see hääl näitleja.
Protsessi keelt on teadvuseta. Me teeme seda ilma mõtlemata, kuidas see protsess toimub: olukord, mis on meie keel, mis suhted on ehitatud vahel häälikuid, ja nii edasi - lihtsalt ja tõhusalt väljendada keerulisi ideid ja emotsioone. Aga selleks, et arvuti kiirenenud heli inimese häält, kõik need tegurid tuleb arvesse võtta. Nagu üks professor lingvistika, on ülesanne "Titanic".
Sa ei tohiks mõelda: "Ma räägin arvuti." Sa ei ole üldjuhul vaja mõelda.
"Minu lapsed interakteeruvad Siri, nagu see oleks elusolend... Nad ei tunne erinevust," - ütleb Ward.
Seni ja sõprust inimeste ja robotite - nagu inimesed. Paljud inimesed sooviksid seda, kui Siri võib tunda emotsionaalset seisundit kõneleja, ja kuidagi reageerida see (näiteks sisaldada rahustav hääl režiim). Kujutage - rääkida robot, mis on moraalselt pat te peas. Võibolla, Nuance on juba mõelda ...