Antra ID Kft. • H-1113 Budapest, Diószegi út 37.
A hatékony beszédfelismerés (emberi beszéd lefordítása szöveges formába) a kritikus része minden hangutasítással működő ipari rendszernek. A hangfelismerés legfontosabb mérőszáma a felismerés pontossága, vajon pontosan lett-e a megértve az elhangzott hangüzenet?
Egyszerűbb megérteni valaki beszédét, ha a hallgató ismeri azt, aki beszél hozzá és már hozzászokott annak beszéd stílusához – különösen akkor, ha a beszélőnek egyedi kiejtése vagy erős akcentusa van. Az a megállapítás különösen igaz a számítógép alapú hangfelismerésnél, és a hasonló alkalmazásokhoz hasonlóan ezt a tényt kell felhasználni a hangfelismerés pontosságának fokozására.
Az emberek könnyen megért olyan beszédet, ahol az egyes szavak összeérnek, nincs közöttük hallható elválasztás, amely szavakra vagy mondatokra osztaná azt. Beszéd hallgatás közben nemcsak az egyes szavak megértésére vagyunk képesek, hanem el tudjuk az egyes szavakat is határolni egymástól. Az ipari alkalmazásoknál a szakaszolt megértés nem elfogadható megoldás. Szünetet tartani a szavak között (például amikor számsorozatot kell bemondani) lassú és idegesítő. Mindegyik ipari alkalmazásra szánt beszédfelismerő rendszer alkalmassá tehető a folyamatos beszéd felismerésére. Habár ez a hangfelismerő rendszert bonyolultabbá teszi, napjainkban lehetséges nagyon magas pontossági aránnyal rendelkező folyamatos beszédfelismerő rendszert készíteni ipari alkalmazások számára.
A szavakat, amelyeket a beszédfelismerő rendszer le kell tudnia fordítani, szótárba kell foglalni. Az embereknek nagy szókincs (szótár) áll rendelkezésükre és ezért több ezer szót vagyunk képesek felismerni. Azoknak a beszédfelismerő rendszereknek, amelyek számítógépes szöveg bevitelre képesek szintén több ezer szavas szótárnak kell rendelkezésre állnia. Ezen rendszereket nagy szótáras rendszereknek nevezik. A beszédfelismerő rendszer megoldások másik véglete azon rendszerek, amelyek arra tervezettek, hogy a felhasználó a felett kérdésekre igennel vagy nemmel válaszolnak, ezek a kis szótáras rendszerek.
A Vocollect termékek folyamatos, kis szótáros, felhasználó függő beszéd felismerő rendszerek. A felhasználók természetes módon, szünetel tartása nélkül beszélhetnek, mivel a hangfelismerés folytonos. A rendszer kis szótáras, mivel ez ad lehetőséget nagyobb teljesítményre (kevesebb hiba, mivel a rendszernek kevesebb szó közti különbséget kell felismernie), és az ipari alkalmazásoknak nincs is szüksége nagy szótárra. A szótár variálható, és ebből következően minden egyes bevezetésnél testre szabható (akár felhasználónként is). Mivel a hangfelismerés függ a beszélőtől, szükséges betanítási munkába időt fektetni, amely viszont többszörösen megtérül a hatékonyság növekedéssel. Mindemellett a felhasználók elégedettsége növekszik a magas megértési pontosságtól (és a nem megértendő szövegrészek elutasításával), amit a betanítási tréning biztosít.