Table of Contents[Hūnā][Hōʻike]
ʻO ke ʻano o kā mākou kamaʻilio ʻana me nā mīkini a me nā hāmeʻa ʻē aʻe ua hoʻololi ʻia e ka hoʻomohala ʻana o ka polokalamu ʻike leo AI.
Hoʻololi ia i nā huaʻōlelo i paʻi ʻia me ka pololei a me ka maikaʻi me ka hoʻohana ʻana i nā algorithms akamai. Aia kēia ʻenehana i nā noi ma nā ʻāpana he nui, mai ka mālama olakino a me ka lawelawe mea kūʻai aku i ka hoʻonaʻauao a me ka ʻoliʻoli.
I nā makahiki i hala iho nei, ua nui ka piʻi ʻana o ka noi no ka hoʻololi ʻana i ka ʻōlelo-i-kikokikona pololei.
Ke ʻike nei nā ʻoihana a me nā poʻe i ka pono nui o ka polokalamu ʻike leo AI i hāʻawi ʻia i ka ulu wikiwiki o ka ʻenehana a me ka ulu ʻana o ka hilinaʻi ʻana i ka kamaʻilio digital.
Loaʻa kēia pono mai ka makemake e hoʻomaikaʻi i ka huahana, streamline kaʻina hana, a hoʻonui i ka hiki no nā poʻe me nā hemahema.
No ke kumu o ka mālama ʻana i nā moʻolelo o nā mea maʻi a hiki i ka hāʻawi ʻana i ka mālama olakino maikaʻi, pono ke kākau pololei a me ka wikiwiki o nā ʻōlelo lapaʻau i nā ʻāpana e like me ke olakino.
Ma ka hana ʻana i ke kaʻina hana unuhi, wehe i ka pono no ka hoʻokomo ʻana i ka ʻikepili manual, a me ka hoʻolako ʻana i ka pololei a me ka wikiwiki, ua puka mai ka polokalamu ʻike leo AI.
Eia hou, ke hoʻohana nei nā māhele lawelawe o nā mea kūʻai aku i kēia ʻenehana e wikiwiki i nā manawa pane a hāʻawi i nā ʻike pilikino.
Hiki i nā ʻoihana ke ʻike i nā mamana, hoʻomaikaʻi i kā lākou lawelawe, a hana i nā koho i alakaʻi ʻia i ka ʻikepili ma ke kākau ʻana i nā kelepona o nā mea kūʻai aku a hōʻiliʻili i ka ʻike ʻike mai kēia mau pilina.
ʻO kahi ʻoihana ʻē aʻe e pōmaikaʻi mai ka polokalamu ʻike leo AI ʻo ia ka hoʻonaʻauao ʻoiai hiki iā ia ke hana i nā mea hana aʻo ʻokiʻoki.
Hiki ke hoʻoikaika ʻia kahi ʻano hoʻonaʻauao ʻoi aku ka ikaika a immersive ma o ka ʻae ʻana i nā haumāna e kuhikuhi i kā lākou mau hana a i ʻole e launa pū me nā kumu aʻo virtual ma o ka leo.
Ua komo pū ka ʻoihana leʻaleʻa i ka ʻenehana ʻike leo AI, e hoʻokaʻawale i ke ala no nā huahana akamai i hoʻoikaika ʻia i ka leo a me nā mea kōkua virtual e hoʻomaikaʻi i ka ʻike mea hoʻohana.
Me nā kauoha haʻiʻōlelo no ka pāʻani media a me nā ʻenekini huli leo, ua maʻalahi a maʻalahi kēia ʻenehana i ka leʻaleʻa.
Ma kēia ʻāpana, e nānā mākou i ka polokalamu ʻike leo AI kiʻekiʻe.
1. Hōʻike
ʻO Rev kahi papahana ʻike leo ʻōlelo i lilo i mea kaulana i waena o nā hui a me nā poʻe e ʻimi nei i nā lawelawe unuhi pololei a maikaʻi no ka ʻikepili leo a me ka wikiō. ʻO ka hoʻohana ʻana o Rev i nā algorithms AI ʻokiʻoki no ka hoʻololi ʻana i ka haʻiʻōlelo i ka kikokikona.
No ka hoʻololi pono ʻana i nā huaʻōlelo i ʻōlelo ʻia i kikokikona, hoʻohana kēia mau algorithm paʻakikī i ka ikaika o aʻo aʻo a me ka hana ʻōlelo kūlohelohe.
Hiki ke ʻike ʻia a wehewehe ʻia e Rev's AI algorithms kahi ʻano ākea o nā leo, dialects, a me nā ʻōlelo mai ka wā i aʻo ʻia ai lākou ma ka nui o ka ʻikepili.
ʻO ka hopena, hiki iā Rev ke hāʻawi i nā lawelawe unuhi pololei loa i hiki ke hana ʻia e hoʻokō i nā pono ʻōlelo kikoʻī. Hiki i ka papahana ke lawelawe i nā ʻano faila leo like ʻole, me nā podcasts, nā hālāwai kūkā, nā nīnauele, a me nā wikiō.
Hoʻokumu mua ʻo Rev i ka pono ma mua o ka pololei, e hāʻawi ana i nā manawa hoʻololi wikiwiki me ka ʻole o ka kaumaha ʻana i ka maikaʻi. Hiki i ka papahana ke hoʻoponopono i ka nui o ka ʻikepili leo a me ka wikiō ma muli o kāna kaila hana i hoʻopaʻa ʻia a me nā ʻōnaehana scalable.
ʻOi aku ka nui o nā lawelawe unuhi ʻōlelo a Rev.
Hoʻohui ʻia, hāʻawi ka papahana i nā koho no ka hoʻopili ʻana, ka ʻike leo ʻōlelo, a me ka timestamping.
Hāʻawi ka Timestamping i ka kikokikona i unuhi ʻia i ka manawa, a ʻo ka ʻike ʻana i ka mea haʻiʻōlelo e maʻalahi ka haʻi ʻana ma waena o nā mea kamaʻilio ʻokoʻa.
Hāʻawi nā koho hōpili i nā mea kūʻai aku i ka hiki ke hoʻololi i ka hōʻike a me ka hoʻolālā o ka palapala e kūpono i kā lākou pono ponoʻī.
kumu kūʻai
Hiki iā ʻoe e hoao ia Rev Max manuahi no 2 pule, a hoʻomaka ka uku kumu kūʻai mai $29.99 / mahina.
2. Nuance Dragon Professional
ʻO Nuance Dragon Professional kahi polokalamu ʻike ʻōlelo alakaʻi i ka mākeke e hāʻawi i kahi pūʻulu piha o nā hiʻohiʻona a me nā hiki ke hiki i nā poʻe loea ma nā ʻano ʻāpana like ʻole.
Me kāna mau hiʻohiʻona kauoha leo maʻalahi, hiki iā ʻoe ke hoʻohana i kā lākou kamepiula me ka lima ʻole i ka wā e hoʻokele ana i nā polokalamu a me ke kuhikuhi ʻana i nā pepa, e hoʻonui ana i ka pono a me ka huahana. Loaʻa i ka papahana kahi pae ʻokoʻa o ka pololei o ka unuhi ʻana, no laila e hoʻololi pono ʻia nā huaʻōlelo i ʻōlelo ʻia i palapala.
Ma ka hāʻawi ʻana i nā huaʻōlelo kūikawā a nā hoʻohālike ʻōlelo, Hoʻokō ʻo Nuance Dragon Professional i nā koi o nā ʻoihana kūikawā. Me ka hoʻohana ʻana i nā puke wehewehe ʻōlelo kūikawā a me nā koho huaʻōlelo, hiki i nā poʻe loea i nā ʻoihana e like me ke olakino, kānāwai, a me ke kālā ke hoʻonui i ka huahana a hana i nā transcripts i ʻoi aku ka pololei.
Eia hou, hiki i ka papahana ke ʻike i nā ʻano ʻōlelo like ʻole a me nā dialects mahalo i nā kiʻi leo leo hiki ke hoʻohana ʻia.
Hiki i nā ʻoihana mālama ola ke hoʻopaʻa i nā memo maʻi, nā ʻikepili olakino, a me nā ʻōlelo kuhikuhi me ka hoʻohana ʻana i ka Nuance Dragon Professional i ka ʻoihana mālama olakino, e hōʻoluʻolu i ke koʻikoʻi hoʻokele a hoʻomaikaʻi i ka mālama maʻi.
Hiki ke hoʻohana ʻia kāna mau hiʻohiʻona ʻōlelo e nā loio e hoʻomākaukau koke i nā pepa hoʻokolokolo a hana i nā moʻolelo hihia.
Hoʻomaʻamaʻa ka papahana i nā kaʻina palapala i ka ʻoihana panakō a me nā ʻoihana ʻinikua, e ʻae i nā poʻe loea e haku wikiwiki a pololei i nā kamaʻilio, nā koi, a me nā hōʻike.
Ma waho aʻe o ka ʻōlelo maʻalahi, hiki iā ʻoe ke hoʻohana i nā ʻōkuhi leo kiʻekiʻe o ka polokalamu e hoʻohana i nā ʻōlelo aʻoaʻo maʻalahi, hoʻokele i nā polokalamu, a hoʻokō i nā hana kamepiula. ʻO ka poʻe me nā pilikia o ka neʻe ʻana a i ʻole ka poʻe makemake i ka hana lima ʻole e ʻike i kēia hiʻohiʻona he mea kōkua nui.
kumu kūʻai
ʻO ka uku kumukūʻai o ka polokalamu e kūʻai ai he $699.
3. Google Cloud Speech-to-Text
ʻO Google Cloud Speech-to-Text kahi polokalamu ʻike leo AI kaulana me nā mana koʻikoʻi a me ka mākaukau ʻenehana.
He koho ia no nā hui a me nā mea hoʻomohala e ʻimi nei i ka hoʻololi ʻana i ka ʻōlelo-i-kikokikona no ka mea he ʻāpana ia o ka Google Cloud Platform a hāʻawi i kahi ʻano hana piha.
ʻO kahi kūlana kūʻokoʻa o ka papahana ʻo ia kona pololei nui, e hoʻohana ana i ka maʻalahi algorithm mīkini hopu e hoʻohuli i nā huaʻōlelo i ʻōlelo ʻia i kikokikona me ka pololei ʻole.
Eia hou, hāʻawi ʻo Google Cloud Speech-to-Text i nā ʻano like ʻole o ka ʻōlelo, hiki iā ʻoe ke unuhi i ka leo ma nā ʻano ʻōlelo like ʻole, nā ʻōlelo a me nā leo. He mea hana pono ia no nā hui multinational a me nā polokalamu e hoʻohana ana i nā ʻōlelo he nui ma muli o kāna uhi ʻōlelo ākea.
Ua kūpono ka papahana no nā noi me ke koi transcription kiʻekiʻe no ka mea hiki iā ia ke lawelawe wikiwiki i ka nui o nā ʻikepili leo me ka hoʻohana ʻana i ka mana o ke ao.
Ma muli o kā Google Cloud Speech-to-Text's cloud-based architecture, hiki i nā mea hoʻomohala ke hoʻohui pono iā ia me nā lawelawe Google Cloud a me nā API no ka hana ʻana i nā polokalamu leo piha.
Hāʻawi ka papahana i nā mana ʻē aʻe e hoʻomaikaʻi i ka pololei a me ka pono o ka palapala, e like me ka moʻolelo haʻiʻōlelo, nā kaha kikoʻī, a me ka ʻike pili.
ʻOiai ʻo ka moʻolelo a ka mea haʻiʻōlelo e hiki ai ke ʻike a hoʻokaʻawale i waena o nā mea haʻiʻōlelo he nui i loko o kahi kūkākūkā, hāʻawi nā kaha kikoʻī i ka maopopo a me ke ʻano o ka hoʻopuka.
He kōkua ka ʻike ʻike i ka wehewehe ʻana a me ka unuhi ʻana o ka leo ma muli o nā kāʻei kapu a i ʻole nā huaʻōlelo pāʻoihana.
kumu kūʻai
He manuahi ka hoʻohana ʻana no 0-60 mau minuke / mahina a hoʻomaka ke kumu kūʻai ma mua o 60 mau minuke / mahina ʻo ia ka $0.024 / minuke.
4. Nā lawelawe ʻōlelo Microsoft Azure
ʻO Microsoft Azure Speech Services kahi ʻenehana ʻike leo hoʻololi pāʻani i hoʻololi i kā mākou pilina me nā mīkini a me nā hāmeʻa. ʻO kāna mau mākau unuhi paʻakikī e hiki ke hoʻololi i nā huaʻōlelo i ʻōlelo ʻia i kikokikona me ka pololei a me ka maikaʻi.
No laila, hiki ke hoʻoponopono ʻia nā hana a hoʻomaikaʻi ʻia ka hiki ke ʻae i nā hui a me nā kānaka e loaʻa nā ʻike ʻike mai ka ʻikepili leo. ʻOi aku ia ma mua o ka ʻike leo maʻalahi ma o ka hoʻokomo ʻana i nā hiʻohiʻona ʻike ʻōlelo kūlohelohe (NLU).
Hiki iā ia ke hoʻomaopopo i ka manaʻo o ka mea hoʻohana a hāʻawi i nā pane kūpono e pili ana i ka pōʻaiapili ma ka nānā ʻana i ka pōʻaiapili a me ke ʻano o nā huaʻōlelo i ʻōlelo ʻia. Ma ka hoʻomaʻamaʻa maʻalahi iā ʻoe e kamaʻilio me nā polokalamu a me nā mea kōkua virtual, ua hoʻomaikaʻi kēia hiki ke hoʻomaopopo i ka ʻōlelo kūlohelohe i ka ʻike mea hoʻohana.
Eia hou, hiki i nā mea hoʻomohala ke hoʻomohala i nā polokalamu leo piha piha me Microsoft Azure Speech Services 'hiki i ka hoʻohui ʻana me nā lawelawe Azure a me nā API.
Hāʻawi ia i nā pahu hoʻomohala polokalamu (SDKs) a me nā API e hiki ai ke hoʻohui maʻalahi me nā noi a me nā ʻōnaehana i loaʻa, a kākoʻo ia i kekahi mau ʻōlelo papahana.
Hāʻawi ʻo Microsoft Azure Speech Services i nā mana e pili ana i ka synthesis haʻiʻōlelo, ka ʻike ʻana i ka ʻōlelo, ka unuhi ʻōlelo, a me ka hoʻomaopopo ʻana i ka ʻōlelo kūlohelohe ma waho o ka transcription a me ka NLU.
Hāʻawi ʻia kahi pae kiʻekiʻe o ka palekana a me ka hana maʻamau ma o ka ʻike ʻana i ka leo, kahi e hiki ai ke ʻike a hōʻoia i kekahi mau mea ʻōlelo.
Hoʻohana ʻia ke kamaʻilio ʻōlelo he nui e nā ʻenehana unuhi ʻōlelo e hiki ai i ka unuhi ʻōlelo manawa maoli i nā ʻōlelo he nui.
Eia kekahi, hoʻomaikaʻi ka synthesis haʻiʻōlelo i ka maikaʻi o nā polokalamu a me nā lawelawe e pili ana i ka leo ma o ka hana ʻana i ka haʻiʻōlelo e like me ka ʻōlelo kanaka.
kumu kūʻai
Hiki iā ʻoe ke hoʻomaka e hoʻohana iā ia no ka manuahi no 5 mau hola leo manuahi i kēlā me kēia mahina a hoʻomaka ka uku kumu kūʻai mai $1 no ka hola leo.
5. Kālā Amazon
He polokalamu pono loa ʻo Amazon Transcribe e hāʻawi ana i nā pono he nui no ka hoʻololi pono ʻana i ka leo i ka kikokikona a me ka ʻike leo.
Me ka scalability koʻikoʻi o kēia hāʻina kapuaʻi mai Amazon Web Services (AWS), hiki i nā hui ke hoʻokele pono i ka nui o ka ʻikepili leo.
Hiki iā Amazon Transcribe ke hoʻololi i nā koi transcription me ka maʻalahi, inā paha no nā hālāwai, nā nīnauele, a i ʻole nā kelepona mālama mea kūʻai. Hiki i nā ʻoihana ke loaʻa nā ʻike koʻikoʻi mai ka ʻike leo ma o ka hoʻohana ʻana i nā transcription pololei i hāʻawi mau ʻia e ka ʻenehana ʻike leo.
ʻO ka hoʻohana ʻana i nā algorithm aʻo mīkini paʻakikī, e aʻo mau ana a ʻoi aku ka maikaʻi i ka manawa, hoʻomaikaʻi nui i ka pololei o Amazon Transcribe.
Hoʻohui ia me nā lawelawe Pūnaewele Amazon ʻē aʻe me ka ʻole o nā pilikia. Me ke kōkua o kēia pilina, hiki i nā hui ke hoʻohui koke i nā mana ʻike leo i kā lākou ʻoihana AWS o kēia manawa, e hōʻemi ana i nā kaʻina hana a hoʻonui i ka pono holoʻokoʻa.
Hoʻohui hou, hāʻawi ʻo Amazon Transcribe i nā metadata hou, e like me nā peʻa manawa, hiki iā ʻoe ke maʻalahi i ka mākaʻikaʻi a me ka huli ʻana ma nā kikokikona i unuhi ʻia.
Hiki iā ia ke kālailai a unuhi i ka nui o ka waihona leo. Hiki i nā ʻoihana ke hoʻohana i ka Amazon Transcribe no ka mālama ʻana i ke kaumaha, e hōʻoiaʻiʻo ana i nā kope wikiwiki a pololei inā he mau minuke a mau hola paha lākou e kākau ai.
kumu kūʻai
Hiki iā ʻoe ke hoʻohana i ka Amazon Transcribe no 60 mau minuke i kēlā me kēia mahina no 12 mau mahina a hoʻomaka ke kumu kumu kūʻai mai $0.02400/minuke.
6. IBM Watson ʻŌlelo i ke kikokikona
ʻO IBM Watson Speech to Text he mea paahana ikaika no ka ʻike leo a me ka unuhi ʻana i loaʻa nā ʻano o nā mana holomua a me nā koho maʻamau. Ua unuhi pololei ʻia ka ʻōlelo i kākau ʻia me ka hoʻohana ʻana i kēia lawelawe kapuaʻi, kahi e hoʻohana ai i ka ʻenehana ʻokiʻoki e like me haʻawina hohonu a me ka hana ʻōlelo kūlohelohe.
Ma muli o kāna kākoʻo ʻōlelo holoʻokoʻa, hiki i nā mea hoʻohana ke unuhi i ka leo ma nā ʻano ʻōlelo a me nā ʻōlelo. No nā hui e hana ana i ka ʻoihana ma waena o ka honua a i ʻole makemake i nā lawelawe unuhi unuhi ʻōlelo, ua lilo kēia ʻano hoʻololi i mea waiwai nui.
Hoʻohui hou, hāʻawi ʻo IBM Watson Speech to Text i nā hiʻohiʻona a me nā huaʻōlelo i loea i kekahi ʻoihana i hiki ke hoʻololi ʻia i kāna mau koi.
Hiki iā IBM Watson Speech to Text ke hoʻololi i nā pono kikoʻī o nā ʻoihana he nui, inā paha ma ka ʻāpana kānāwai, kālā, a i ʻole mālama ola kino.
ʻO ka hiki o IBM Watson Speech to Text e mālama i ka leo ma ke ʻano batch a i ʻole i ka manawa maoli e hāʻawi iā ʻoe i ka maʻalahi e pili ana i kāu pono ponoʻī. ʻOiai e hana maikaʻi ana ka unuhi ʻana no nā faila leo i hoʻopaʻa mua ʻia, ʻoi aku ka maikaʻi o ka unuhi ʻana i ka manawa maoli no nā noi e like me ka loiloi haʻiʻōlelo a me ka captioning ola.
Eia kekahi, loaʻa iā IBM Watson Speech to Text nā hiʻohiʻona diarization leo ʻōlelo e hiki ai ke ʻike a me ka hoʻokaʻawale ʻana o nā ʻōlelo like ʻole i loko o kahi kumu leo.
Inā nui nā mea haʻiʻōlelo, e like me ka wā o ka hoʻopaʻa ʻana i ka hālāwai kūkā a i ʻole nā nīnauele, kōkua nui kēia hana. Ma muli o kona pilina paʻa ʻole me nā lawelawe IBM Watson ʻē aʻe a me nā API, hiki i nā mea hoʻomohala ke hana wikiwiki a maʻalahi i nā polokalamu hoʻoikaika leo ikaika.
kumu kūʻai
Hiki iā ʻoe ke hoʻohana i ka lawelawe no 500 mau minuke o ka ʻike ʻōlelo manuahi i hoʻokahi mahina a hoʻomaka ka uku kumu kūʻai mai $0.01/minuke.
7. Hāwanawana OpenAI
ʻO OpenAI Whisper kahi API ʻike leo ʻokiʻoki e hoʻohana ana i nā ʻenehana ʻokiʻoki e hoʻokō i ka hana koʻikoʻi. He hopena hilinaʻi ʻo Whisper no nā hui a me nā mea hoʻomohala no ka mea ua hoʻololi pololei ʻo ia i ka ʻōlelo ʻōlelo i loko o nā kikokikona i kākau ʻia ma muli o kāna mau hiʻohiʻona aʻo mīkini ikaika.
He mea kaulana kēia API no kona hiki ke unuhi i nā leo leo i nā ʻōlelo, nā dialects, a me nā leo ʻē aʻe, e lawelawe ana i kahi waihona mea hoʻohana like ʻole.
Hiki i ka ʻōnaehana OpenAI Whisper ke hoʻomaopopo a hoʻomaopopo i nā ʻano like ʻole a me nā ʻano like ʻole mai ka mea i kūkulu ʻia ma luna o kahi hoʻonohonoho ʻikepili aʻo nui.
Hāwanawana kikowaena pili pūnaewele ua hoʻomaʻamaʻa ʻia ma nā puke nui o ka ʻikepili leo mahalo i hiki iā ia ke ʻike a kākau i nā ʻōlelo ʻōlelo me ka pololei kupaianaha.
Hāʻawi ia i nā lawelawe unuhi pololei a ʻike ʻia i ka hoʻohana ʻana i nā ʻāpana e pili ana i ka mālama olakino, lawelawe mea kūʻai aku, a me ka media. Hiki ke kōkua ʻo Whisper i ka ʻōlelo lapaʻau ma ka ʻoihana mālama ola, kōkua i ka poʻe akamai i ka mālama ʻana i ka ʻikepili maʻi kūpono.
Hāʻawi ia i ka transcription o nā mea kūʻai aku i ka lawelawe lawelawe, hoʻonui i ka nānā ʻana a me ka mana maikaʻi. I mea e hoʻomaikaʻi ai i ka ʻike a me ka ʻike ʻana i ka ʻike, hiki i nā hui media ke hoʻohana hou iā Whisper e kākau i nā nīnauele, podcast, a me nā mea wikiō.
ʻO ka pololei nui o OpenAI Whisper ka huahana o kāna mau aʻo ʻana a me ka hoʻomohala ʻana. Hoʻomaikaʻi ʻia ka hiki ke kākau ʻana o Whisper ma muli o nā hiʻohiʻona āna e hoʻohana ai, e loli ana i ka wā e hoʻoili ʻia ai nā ʻikepili hou aʻe a loaʻa ka hoʻokomo.
ʻO kēia hoʻomaikaʻi mau ʻana e hōʻoiaʻiʻo i ka noho ʻana o ka API ma ka ʻokiʻoki o ka ʻenehana ʻike leo, e hāʻawi ana i nā mea kūʻai aku i nā hopena maikaʻi loa.
kumu kūʻai
Hoʻomaka ke kumu kūʻai kumukūʻai o ke kŘkohu mai $0.006/minuke.
8. Nā haʻiʻōlelo
He alakaʻi makeke ka Speechmatics i ka ʻenehana ʻike leo, e hāʻawi ana i kahi API haʻi-i-kiko ikaika a pololei. ʻOi aku ka maikaʻi o ka Speechmatics i ka hoʻololi pololei ʻana i ka ʻōlelo i kākau ʻia ma o ka hoʻohana ʻana i nā algorithm ʻokiʻoki a me nā ʻano aʻo hohonu.
He mea hana pono ia no nā ʻano noi like ʻole, me ka hoʻopili ʻana i ka media, kikowaena pili analytics, a me ka helu helu ʻana ma muli o kona hiki ke unuhi pololei.
Hiki i ka Speechmatics ke unuhi pono i ka ʻike leo mai nā ʻano kumu ʻōlelo like ʻole ma muli o kāna kākoʻo ʻōlelo ākea, ʻo ia hoʻi nā dialects a me nā leo.
ʻAʻohe o ka ʻōlelo e ʻōlelo ʻia nei, hiki iā ʻoe ke kope a hoʻomaopopo pono i nā kikokikona i haʻi ʻia ma muli o kēia mana ʻōlelo ʻōlelo. Hāʻawi ka Speechmatics i nā ʻike hilinaʻi a pololei inā no ka ʻōlelo Pelekania, Paniolo, Mandarin, a i ʻole nā ʻōlelo ʻē aʻe.
Hoʻomaikaʻi mau ʻia ka ʻenehana lalo o Speechmatics a aʻo ʻia mai, e ʻae iā ia e hoʻololi i nā ʻano ʻōlelo like ʻole, nā leo, a me nā mea ambient.
ʻO ka hoʻolaʻa ʻana o Speechmatics i ka hana hou e hoʻomau i ke alakaʻi ʻana i ke kahua o ka ʻenehana ʻike leo a hāʻawi i kāna mau mea kūʻai aku i ka hoʻololi ʻana i ka haʻiʻōlelo i ka kikokikona.
kumu kūʻai
Hoʻomaka ka uku kumu kūʻai mai $0.80/hr batch (hoʻopaʻa mua ʻia) a me $1.04/hr no ka manawa maoli (ke kahawai ola).
9. Deepgram
ʻO Deepgram, he paionia i ka ʻike leo a me ka ʻenehana unuhi, hāʻawi i kahi kumu paʻa no ka hoʻololi ʻana i nā leo i ka kikokikona pololei loa me ka hoʻohana ʻana. nā kumu hoʻohālike hohonu.
Hiki i nā kumu hoʻonaʻauao hohonu i kūkulu ʻia i loko o ka paepae ke hoʻomaopopo a hoʻonohonoho i nā ʻano like ʻole a me nā ʻano like ʻole mai ka wā i aʻo ʻia ai lākou ma ka nui o ka ʻikepili.
ʻO ka pololei a me ka hiki o Deepgram ke kiʻi i nā mea maʻalahi i loko o nā mea i haʻi ʻia ma muli o kāna hoʻomaʻamaʻa ikaika. Ma muli o ka maʻalahi o ka paepae, ʻoi aku ka pololei o nā unuhi no ka mea hiki iā ia ke hoʻokele i nā ʻano leo like ʻole, nā ʻōlelo, a me nā huaʻōlelo kikoʻī o ka ʻoihana.
Hiki iā ia ke hoʻopuka i nā ʻike pololei ʻoiai ma nā kūlana haʻahaʻa maikaʻi ʻole ma muli o kāna mau hiʻohiʻona hoʻonaʻauao hohonu, e hiki ai iā ia ke hoʻokele i nā kūlana auditory paʻakikī a me ka walaʻau hope.
Hoʻohui hou, loaʻa kekahi mau mana ʻenehana ma ka ʻike leo a me ka pae transcription o Deepgram e hoʻomaikaʻi i ka ʻike mea hoʻohana..
Hiki iā ʻoe ke loaʻa i nā transcription koke o nā kamaʻilio ola a i ʻole nā hanana ma muli o kona hiki ke hoʻoponopono manawa maoli. Hiki i ka Deepgram ke hoʻololi i nā pūʻulu, e hiki ai ke kākau maikaʻi i nā ʻikepili leo nui.
kumu kūʻai
Hiki iā ʻoe ke hoʻomaka e hoʻohana iā ia no ka manuahi a hoʻomaka ka uku kumu kūʻai mai $4k/makahiki.
10. Siri
Ua ulu a kaulana ʻo Siri ma ke ʻano he mea ʻike a hoʻohana maʻamau ʻia nā polokalamu polokalamu ʻike ʻōlelo i loaʻa i kēia lā. He mea kōkua punahele punahele no nā miliona o nā mea nona nā polokalamu Apple ma ka honua holoʻokoʻa, ua ʻike ʻia ʻo Siri no kāna hoʻolālā hoʻohana-aloha a me nā pilina leo.
He mea kōkua leo ʻo Siri e hiki ke hoʻokō i nā hana like ʻole me hoʻokahi kauoha i ʻōlelo ʻia, me ka hana ʻana i nā hoʻomanaʻo, ka hoʻouna ʻana i nā memo, ke kau ʻana i nā kelepona, a me ka pane ʻana i nā nīnau e pili ana i ka ʻike ākea.
ʻO ka hui pū ʻana o Siri me nā huahana Apple, e like me iPhones, iPads, Macs, a me HomePods, ʻo ia ka mea e hoʻokaʻawale ai ia mai nā mea kōkua kikohoʻe ʻē aʻe.
Hiki iā ʻoe ke komo iā Siri me ka hoʻohana ʻana i nā mea like ʻole e hoʻomaikaʻi i kēia hoʻohui, e hōʻoiaʻiʻo ana i kahi ʻike mea hoʻohana maʻalahi a paʻa. Loaʻa ʻo Siri i nā manawa āpau, inā ʻoe e hana ana ma kāu Mac a i ʻole iPhone ke hele ʻoe ma ke ala.
ʻAʻohe mea hōʻole i ka pono a me ka hoʻololi ʻana o Siri i ke ola o kēlā me kēia lā. Me ko lākou leo wale nō, hiki iā ʻoe ke hoʻohana iā Siri e hoʻokele i kā lākou papa manawa, hoʻouna i nā leka uila, mākaʻikaʻi ma nā palapala ʻāina, a hana i nā hāmeʻa home akamai. Hiki iā ʻoe ke hoʻomau i ka pili ʻana a me ka hoʻohua ʻana i ka wā e hele ai e hoʻomaikaʻi i kēia ʻano hana lima lima ʻole, kahi e mālama ai i ka manawa.
Eia hou, ke ulu mau nei ʻo Siri a ʻoi aku ka maikaʻi. Hoʻololi pinepine ʻo Apple i nā mana o Siri, hoʻonui i kona hiki no ka wehewehe ʻana a me ka hana ʻana i ka ʻōlelo kūlohelohe, hoʻonui i kona kumu ʻike, a hoʻohui i nā hana hou.
Ma ka mālama ʻana i kāna alakaʻi i ka ʻenehana ʻike ʻōlelo ma o ka hoʻomohala mau ʻana, hiki iā Siri ke hoʻomau i ka hāʻawi ʻana iā ʻoe i kahi ʻike maʻalahi a maʻamau.
kumu kūʻai
He manuahi ka hoʻohana ʻana no kēlā me kēia kanaka.
Panina
I ka hopena, ua hoʻololi piha ka polokalamu ʻike leo i hoʻohana ʻia e AI i ke ʻano o kā mākou launa ʻana me ka ʻenehana a ua lilo i mea koʻikoʻi no nā ʻāpana like ʻole.
ʻO nā ʻano hana like ʻole, mai Microsoft Azure Speech Services a me OpenAI Whisper iā Google Cloud Speech-to-Text a me Nuance Dragon Professional, e hōʻike ana i ka hoʻomohala ʻana a me ka hoʻololi ʻana o kēia mau ʻōnaehana.
Paipai au i ka poʻe heluhelu e noiʻi a nānā pono i kā lākou makemake a me nā koi ponoʻī ma mua o ke koho ʻana i ka polokalamu ʻike leo AI e hoʻokō maikaʻi loa i kā lākou mau pahuhopu no ka mea he ʻokoʻa nā hiʻohiʻona kūikawā a me nā mea hiki i kēlā me kēia ʻāpana polokalamu.
Hiki iā ʻoe ke hoʻokō i nā pae hou o ka huahana, ka pono, a me ka ʻike mea hoʻohana i kāu hoʻoikaika pilikino a me ka ʻoihana ma ka ʻae ʻana i kēia ʻenehana ikaika.
Daniel A. Rose
Ke hana nei au i nā hoʻohālikelike no ka hana, aia kekahi mau mea āu e makemake ai e hoʻoponopono.
1. ʻAʻole like ʻo Siri me nā mea ʻē aʻe. ʻAʻole ʻo Siri he mea hoʻomohala.
2. ʻO ke kumu kūʻai a Rev āu i hoʻokaʻawale ai, no ka palapala kanaka, ʻoiai ʻo nā mea ʻē aʻe i hoʻokumu ʻia ma ka palapala mīkini. Inā ʻoe e nānā i ka palapala mīkini a Rev, ua hoʻokūkū nō hoʻi kona kumukūʻai. https://www.rev.ai/pricing
3. Nalo ʻoe iā Picovoice nāna e hāʻawi i ke kumu hoʻohālike ma ka polokalamu e holo ana ma ke ʻano he mōhai lawelawe. ʻAʻole hele mai nā ʻōlelo maʻamau e like me Whisper me ke kākoʻo ʻenehana a paʻakikī loa ka hana maʻamau. Hāʻawi lākou i ke kākoʻo nui a me ka maʻalahi o ka hana maʻamau. https://picovoice.ai/platform/cat/