百度大腦在北京舉行語音能力引擎論壇。百度語音首席架構(gòu)師賈磊正式提出基于復數(shù)CNN網(wǎng)絡的語音增強和語音識別一體化端到端建模技術(shù),該方法拋棄了數(shù)字信號處理學科和語音識別學科的各種先驗假設,消除學科間壁壘,直接端到端進行一體化建模。相較于傳統(tǒng)基于數(shù)字信號處理的麥克陣列算法,錯誤率降低超過30%。
據(jù)悉,這項技術(shù)無需任何數(shù)字信號處理和語音識別學科的先驗假設,復數(shù)CNN網(wǎng)絡內(nèi)存占用少于200K,可以內(nèi)置到百度鴻鵠芯片內(nèi)部。利用進場數(shù)據(jù)和純粹依靠仿真數(shù)據(jù),就可以獲得足量的遠場訓練數(shù)據(jù),整個過程是icing原始多麥克信號到識別文字的一個端到端訓練,整個優(yōu)化過程只有字錯誤率兩集一個優(yōu)化準則。
百度從2012年起就開始把深度學習用于中文語音搜索,成為全世界最早把深度學習技術(shù)落地工業(yè)化產(chǎn)品的企業(yè)之一。百度大腦目前已開放了云、端、芯包含語音識別、語音合成等全棧語音引擎能力,并廣泛應用于金融、政務、文娛等多種行業(yè)和場景。
百度AI技術(shù)生態(tài)部總經(jīng)理喻友平表示,百度大腦語音能力引擎的應用規(guī)模已達到業(yè)界第一,同時一直在積極拓展語音能力引擎生態(tài)鏈的建設。
隨著人們生活水平的提高及對家居環(huán)境要求的提升,智能家居產(chǎn)品正逐漸從奢侈品轉(zhuǎn)變?yōu)槿粘I钪械?..
工業(yè)和信息化部、交通運輸部、住房和城鄉(xiāng)建設部、公安部、自然資源部聯(lián)合發(fā)布了智能網(wǎng)聯(lián)汽車“車...
賽迪顧問發(fā)布了“2025人工智能企業(yè)綜合實力TOP100榜單”。榜單顯示,阿里巴巴、華為、...
AI大模型有哪些?據(jù)了解,我國已備案的大模型包括百度的“文心一言”、智譜AI的“GLM大模...
陳宗年,中國電子科技集團有限公司中電??导瘓F有限公司董事長、黨委書記。在他的帶領下, ???..
2024福布斯中國科創(chuàng)人物評選結(jié)果重磅發(fā)布,本次榜單主要聚焦深耕于人工智能、高端制造等科創(chuàng)...