近兩年,隨著“一帶一路”建設(shè)的深入推進(jìn)以及國(guó)內(nèi)5G、大數(shù)據(jù)、AI和云計(jì)算等新興技術(shù)產(chǎn)業(yè)迅速崛起,已經(jīng)有越來越多的中國(guó)科技企業(yè)實(shí)現(xiàn)走出去。據(jù)白鯨出海數(shù)據(jù)顯示,2019年中國(guó)出海企業(yè)共7415家,游戲、社交、短視頻直播、手機(jī)及硬件、電商等占據(jù)了80%以上的份額。
然而,對(duì)于主打AI語音產(chǎn)品的企業(yè)來說,出海之路仍面臨諸多難題。在海外市場(chǎng),除了要面對(duì)不同的市場(chǎng)環(huán)境、人文特征、技術(shù)安全、數(shù)據(jù)合規(guī)等一系列挑戰(zhàn),首當(dāng)其沖的應(yīng)屬當(dāng)?shù)劐e(cuò)綜復(fù)雜的語言問題。通過準(zhǔn)確而清晰的合成語音實(shí)現(xiàn)與當(dāng)?shù)赜脩?ldquo;無礙溝通”,是智能語音產(chǎn)品能夠打開市場(chǎng)的基本前提。
跨越語言門檻打造高質(zhì)量語音合成
眾所周知,數(shù)據(jù)作為人工智能的“燃料”,在實(shí)現(xiàn)人機(jī)交互的過程中發(fā)揮了舉足輕重的作用。而語音合成為機(jī)器提供聲音支持,是語音交互的前提。
據(jù)了解,目前世界上共有7000多種語言,其中使用人數(shù)超過5000萬的語言僅有10余種。小語種,顧名思義即語言覆蓋范圍小,使用人數(shù)少而無法作為國(guó)際流通語言。對(duì)于小語種合成語音的實(shí)現(xiàn)而言,由于不同語言之間差異很大,開發(fā)商需要根據(jù)不同的語言特性單獨(dú)建模。為保證語音合成效果,就需要運(yùn)用不同語種的優(yōu)質(zhì)數(shù)據(jù)集進(jìn)行模型優(yōu)化。
語音數(shù)據(jù)庫(kù)的采集是把各個(gè)語種常用句子、詞語以語音的方式搜集記錄下來,組成一個(gè)數(shù)據(jù)集,標(biāo)注則是將采集好的數(shù)據(jù)通過標(biāo)重點(diǎn)、打標(biāo)簽、框?qū)ο蟆⒆鲎⑨尩仁侄巫鞒鰳?biāo)注,再將這些采集并完成標(biāo)注的數(shù)據(jù)集給機(jī)器訓(xùn)練和學(xué)習(xí),成功發(fā)出媲美當(dāng)?shù)厝说穆曇?。因此,小語種種類越多,需要完成的語音數(shù)據(jù)采集和標(biāo)注工作也就越多。
當(dāng)前,高質(zhì)量小語種訓(xùn)練數(shù)據(jù)稀缺,成為語音合成的一大瓶頸。
多語種、多場(chǎng)景小語種語音數(shù)據(jù)集
作為國(guó)內(nèi)領(lǐng)先的AI數(shù)據(jù)服務(wù)提供商,標(biāo)貝科技擁有專業(yè)的數(shù)據(jù)處理團(tuán)隊(duì)和強(qiáng)大的數(shù)據(jù)采集、處理能力,在數(shù)據(jù)采集和語料標(biāo)注方面具備豐富的實(shí)踐經(jīng)驗(yàn),可以提供語音合成技術(shù)建模和測(cè)試需要的深度標(biāo)注加工的數(shù)據(jù)服務(wù)。
面對(duì)小語種語音數(shù)據(jù)的需求難題,標(biāo)貝科技推出一系列小語種語音數(shù)據(jù)集,覆蓋葡語、俄語、印尼語、西語、法語、韓語、德語、意大利語、日語等多個(gè)語種,并完成對(duì)數(shù)據(jù)集的音標(biāo)、重音標(biāo)注、韻律標(biāo)注,可供算法優(yōu)化直接使用,助力中國(guó)智能語音產(chǎn)品順利出海。