移動(dòng)端
方案網(wǎng)小程序
方案網(wǎng)手機(jī)端
加小編微信入群
發(fā)布成功
開發(fā)一款實(shí)時(shí)將音頻轉(zhuǎn)換為文字的程序,并進(jìn)行文本無關(guān)模式的說話人辨認(rèn)。該設(shè)備為基礎(chǔ)設(shè)備,可外接音頻輸入或麥克風(fēng)設(shè)備。
1、離線聲紋識(shí)別模塊,采用文本無關(guān)模式進(jìn)行特定人的聲紋學(xué)習(xí),并將聲
紋進(jìn)行編號(hào),在之后音頻轉(zhuǎn)文字采集時(shí),如果聲紋庫中存在此聲音的所有人,則將特定人的音頻內(nèi)容標(biāo)記為特定人。
a、聲紋學(xué)習(xí)要多少秒?
b、聲紋識(shí)別要多少秒?
實(shí)施細(xì)節(jié):
將聲紋存儲(chǔ)于SD卡內(nèi),并采用SQLite數(shù)據(jù)庫建立聲紋與特定人的關(guān)聯(lián)關(guān)系。
2、將實(shí)時(shí)語音實(shí)時(shí)轉(zhuǎn)為文字。
a、采用實(shí)時(shí)語音識(shí)別(也可采用阿里云等實(shí)時(shí)識(shí)別SDK)
b、將語音與存儲(chǔ)的所有聲紋對(duì)比后如果有匹配的聲紋,則將語音與聲紋建立關(guān)聯(lián)。
如:{386}語音正文內(nèi)容 386既為聲紋id
實(shí)施細(xì)節(jié):
將實(shí)時(shí)音頻轉(zhuǎn)文字后存儲(chǔ)于SD卡內(nèi)的SQLite數(shù)據(jù)庫中。
1、我愛方案網(wǎng)是會(huì)員制服務(wù),服務(wù)商通過競(jìng)標(biāo)后即可聯(lián)系雇主;
2、項(xiàng)目預(yù)算與報(bào)價(jià)不代表最終成交價(jià)格,成交價(jià)以雙方協(xié)商為準(zhǔn);
3、平臺(tái)提供設(shè)計(jì)項(xiàng)目對(duì)接服務(wù),希望促成高效合作,對(duì)交易雙方不收取傭金,謝謝留意!