中安觀察|拿下一等獎(jiǎng)!科大訊飛這項(xiàng)技術(shù)有多牛?
中安在線、中安新聞客戶端訊 安徽又一科技創(chuàng)新成果出圈!
6月24日,國(guó)家科學(xué)技術(shù)獎(jiǎng)勵(lì)大會(huì)上,由科大訊飛牽頭,聯(lián)合中國(guó)科學(xué)技術(shù)大學(xué)、清華大學(xué)、華為終端有限公司、中移(杭州)信息技術(shù)有限公司等高校及行業(yè)領(lǐng)軍企業(yè)聯(lián)合完成的“多語(yǔ)種智能語(yǔ)音關(guān)鍵技術(shù)及產(chǎn)業(yè)化”項(xiàng)目榮獲2023年度國(guó)家科學(xué)技術(shù)進(jìn)步獎(jiǎng)一等獎(jiǎng)。
一、含金量高
科技創(chuàng)新,始終是國(guó)家關(guān)心關(guān)切的大事,是推動(dòng)國(guó)家發(fā)展的核心動(dòng)力,也是當(dāng)今發(fā)展新質(zhì)生產(chǎn)力的“牛鼻子”。
1984年,國(guó)務(wù)院創(chuàng)立國(guó)家科學(xué)技術(shù)進(jìn)步獎(jiǎng),設(shè)一、二兩個(gè)獎(jiǎng)勵(lì)等級(jí),旨在激勵(lì)科技人才,促進(jìn)成果轉(zhuǎn)化。如今,該獎(jiǎng)已成為國(guó)務(wù)院設(shè)立的國(guó)家科學(xué)技術(shù)獎(jiǎng)五大獎(jiǎng)項(xiàng)(國(guó)家最高科學(xué)技術(shù)獎(jiǎng)、國(guó)家自然科學(xué)獎(jiǎng)、國(guó)家技術(shù)發(fā)明獎(jiǎng)、國(guó)家科學(xué)技術(shù)進(jìn)步獎(jiǎng)、中華人民共和國(guó)國(guó)際科學(xué)技術(shù)合作獎(jiǎng))之一。

科大訊飛牽頭項(xiàng)目榮獲2023年度國(guó)家科學(xué)技術(shù)進(jìn)步獎(jiǎng)一等獎(jiǎng)
為突出質(zhì)量?jī)?yōu)先、寧缺毋濫,進(jìn)一步增強(qiáng)獎(jiǎng)項(xiàng)的學(xué)術(shù)性、權(quán)威性和榮譽(yù)性,2017年,國(guó)家自然科學(xué)獎(jiǎng)、國(guó)家技術(shù)發(fā)明獎(jiǎng)、國(guó)家科學(xué)技術(shù)進(jìn)步獎(jiǎng)三大獎(jiǎng),總數(shù)由不超過(guò)400項(xiàng)減少到不超過(guò)300項(xiàng),此后經(jīng)多次變革,讓其競(jìng)爭(zhēng)難度進(jìn)一步提升,換言之,能獲獎(jiǎng)的,在當(dāng)今中國(guó),都可謂科技創(chuàng)新的巔峰之作。
如何才能獲獎(jiǎng)?
根據(jù)《國(guó)家科學(xué)技術(shù)獎(jiǎng)勵(lì)條例》規(guī)定,國(guó)家科學(xué)技術(shù)進(jìn)步獎(jiǎng),授予完成和應(yīng)用推廣創(chuàng)新性科學(xué)技術(shù)成果,以及為推動(dòng)科學(xué)技術(shù)進(jìn)步和經(jīng)濟(jì)社會(huì)發(fā)展作出突出貢獻(xiàn)的個(gè)人、組織。
可見,想獲獎(jiǎng),滿足創(chuàng)新性科學(xué)技術(shù)成果的同時(shí),成果還要得到應(yīng)用和推廣。
值得一提的是,受過(guò)去兩年國(guó)家科技獎(jiǎng)暫停的緣故,2023年度國(guó)家科技獎(jiǎng)積累了大量?jī)?yōu)秀成果,堪稱國(guó)獎(jiǎng)史上最難一年,提名環(huán)節(jié)指標(biāo)難拿、初評(píng)環(huán)節(jié)網(wǎng)評(píng)難過(guò),答辯環(huán)節(jié)競(jìng)爭(zhēng)極其激烈。
以此次獲獎(jiǎng)的科大訊飛牽頭“多語(yǔ)種智能語(yǔ)音關(guān)鍵技術(shù)及產(chǎn)業(yè)化”項(xiàng)目為例,該項(xiàng)目所屬計(jì)算機(jī)與自動(dòng)控制組評(píng)審組,據(jù)悉,今年該組受理45個(gè)項(xiàng)目,通過(guò)初評(píng)的僅有8項(xiàng),通過(guò)率不到18%。因此,榮獲此次殊榮,含金量不言而喻。
二、應(yīng)用度廣
作為智能語(yǔ)音行業(yè)的執(zhí)牛耳者,來(lái)自合肥高新區(qū)的科大訊飛,長(zhǎng)期聚焦多語(yǔ)種智能語(yǔ)言技術(shù)研發(fā)和應(yīng)用,在迎接市場(chǎng)環(huán)境新挑戰(zhàn)的同時(shí),不斷進(jìn)行技術(shù)創(chuàng)新,推動(dòng)應(yīng)用落地。如今,在全球化背景下,乘勢(shì)而上,讓技術(shù)成果逐步從實(shí)驗(yàn)室走向應(yīng)用場(chǎng),在各行各業(yè)諸多場(chǎng)景中,得到廣泛應(yīng)用。
此次獲獎(jiǎng)“多語(yǔ)種智能語(yǔ)音技術(shù)”,是科大訊飛聯(lián)合多個(gè)單位研發(fā)的包含多語(yǔ)種語(yǔ)音識(shí)別、多語(yǔ)種語(yǔ)音合成、多語(yǔ)種翻譯技術(shù)等為一體的綜合技術(shù),不僅硬核,還很實(shí)用。
先看技術(shù)本身,大體來(lái)看,多語(yǔ)種智能語(yǔ)音技術(shù)功能有三:
·語(yǔ)音識(shí)別:通過(guò)先進(jìn)的算法,如深度學(xué)習(xí),系統(tǒng)能夠準(zhǔn)確地將人類的語(yǔ)音轉(zhuǎn)換為文本。
·語(yǔ)音合成:利用自然語(yǔ)言處理技術(shù),可以將文本轉(zhuǎn)換為流暢自然的語(yǔ)音輸出。
·機(jī)器翻譯:結(jié)合語(yǔ)言學(xué)和計(jì)算機(jī)科學(xué),實(shí)現(xiàn)不同語(yǔ)言之間的高質(zhì)量自動(dòng)翻譯。
據(jù)悉,連同6個(gè)聯(lián)合國(guó)通用語(yǔ)種(漢語(yǔ)、英語(yǔ)、法語(yǔ)、西班牙語(yǔ)、俄語(yǔ)、阿拉伯語(yǔ)在內(nèi)),此技術(shù)共支持世界69個(gè)語(yǔ)種,其中不乏挪威語(yǔ)、丹麥語(yǔ)等54個(gè)小語(yǔ)種,且均達(dá)到使用門檻。
同時(shí),項(xiàng)目還覆蓋維、藏、蒙、哈、朝、壯、彝等24種主要中國(guó)方言,未來(lái)還將覆蓋更多方言。
這項(xiàng)技術(shù)有多牛?
記者從科大訊飛了解到,在CHiME、openASR、Blizzard Challenge、IWSLT等國(guó)際權(quán)威比賽中,該技術(shù)的成績(jī)可謂“遙遙領(lǐng)先”,近五年就累計(jì)獲得國(guó)際權(quán)威評(píng)測(cè)冠軍20余項(xiàng);在與谷歌、微軟等國(guó)際廠商的盲測(cè)對(duì)比中,該技術(shù)也實(shí)現(xiàn)了多個(gè)語(yǔ)種整體并跑,14個(gè)重點(diǎn)語(yǔ)種領(lǐng)跑。
在產(chǎn)業(yè)化方面,據(jù)德勤數(shù)據(jù)發(fā)布的《2020-2021中國(guó)語(yǔ)音產(chǎn)業(yè)發(fā)展白皮書》及華經(jīng)產(chǎn)業(yè)研究院的《2023-2028年中國(guó)智能語(yǔ)音行業(yè)市場(chǎng)發(fā)展現(xiàn)狀及投資方向研究報(bào)告》,國(guó)內(nèi)市場(chǎng)份額科大訊飛穩(wěn)居第一,在全球多語(yǔ)種市場(chǎng)中,占比也在持續(xù)提升。
眼前便是例證。會(huì)議轉(zhuǎn)寫方面,截至2024年,借用該項(xiàng)技術(shù)的訊飛聽見APP,已全面覆蓋人大政協(xié)各個(gè)駐地會(huì)議三周年。

訊飛聽見APP助力聽障人士日常交流
今年全國(guó)兩會(huì),為更好輔助會(huì)議簡(jiǎn)報(bào)記錄工作,科大訊飛推出“訊飛聽見智慧簡(jiǎn)報(bào)系統(tǒng)”,實(shí)現(xiàn)將會(huì)議發(fā)言,實(shí)時(shí)轉(zhuǎn)成文字,且全程離線進(jìn)行,在保證簡(jiǎn)報(bào)記錄原汁原味,內(nèi)容詳實(shí)的同時(shí),也確保了會(huì)議的信息安全。
與此同時(shí),訊飛多語(yǔ)種智能語(yǔ)音技術(shù),已助力國(guó)內(nèi)車企以及華為等品牌的產(chǎn)品出海。其中,中國(guó)汽車出海10強(qiáng)企業(yè)中有8家和科大訊飛合作,覆蓋23個(gè)語(yǔ)種,出口60余個(gè)國(guó)家。
還有在業(yè)界開創(chuàng)的智能翻譯機(jī)、智能錄音筆、智能辦公本等新品類。以訊飛翻譯機(jī)為例,可在線翻譯支持85個(gè)語(yǔ)種,覆蓋全球200多個(gè)國(guó)家和地區(qū),支持17個(gè)語(yǔ)種無(wú)網(wǎng)絡(luò)翻譯,35個(gè)語(yǔ)種自動(dòng)識(shí)別翻譯,32個(gè)語(yǔ)種拍照翻譯,可解決用戶全球旅游、商務(wù)等跨語(yǔ)言溝通問(wèn)題,已在北京冬奧會(huì)、進(jìn)博會(huì)、博鰲論壇、海關(guān)等重大活動(dòng)和場(chǎng)景中獲廣泛應(yīng)用。
還有助力公益。2017年,科大訊飛發(fā)起“方言保護(hù)計(jì)劃”,截至目前,方言庫(kù)收集近170萬(wàn)條方言,貢獻(xiàn)人數(shù)超過(guò)85萬(wàn),其成果已在影視、教育、文旅、媒體等多個(gè)行業(yè)尋找到可切實(shí)落地的應(yīng)用場(chǎng)景。
此外,自2019年起,科大訊飛聯(lián)合中國(guó)聾協(xié)、中國(guó)殘疾人藝術(shù)團(tuán)發(fā)起“聽見AI的聲音”公益關(guān)愛行動(dòng),為聽力障礙人士提供免費(fèi)的實(shí)時(shí)語(yǔ)音轉(zhuǎn)文字服務(wù)、捐贈(zèng)免費(fèi)時(shí)長(zhǎng)。截至今年6月,已累計(jì)捐贈(zèng)時(shí)長(zhǎng)超一億分鐘。
三、大模型時(shí)代
2023年,可謂AI元年,大模型興起、諸多公司跑步進(jìn)場(chǎng),“大模型是AI時(shí)代的基礎(chǔ)設(shè)施”的提法漸漸深入人心。

2024消博會(huì)上科大訊飛帶來(lái)AI消費(fèi)新體驗(yàn)
與此同時(shí),語(yǔ)音是人類信息傳播的基本方式,多語(yǔ)種智能語(yǔ)音技術(shù),在支撐人機(jī)交互、人類語(yǔ)言互通等方面,都具有重大戰(zhàn)略意義。
將AI大模型與多語(yǔ)種智能語(yǔ)音技術(shù)進(jìn)行結(jié)合,將會(huì)是怎樣的未來(lái)?這是當(dāng)今國(guó)際科技競(jìng)爭(zhēng)的焦點(diǎn),也是科大訊飛正著力描繪的未來(lái)。
語(yǔ)音屬性解耦、語(yǔ)音信號(hào)時(shí)空分離等技術(shù)突破,可以將語(yǔ)音信號(hào)經(jīng)過(guò)編碼后輸入到大語(yǔ)言模型,顯著提升語(yǔ)音大模型的效果。大模型技術(shù)可以在復(fù)雜語(yǔ)義理解、長(zhǎng)文本建模能力上進(jìn)一步提升語(yǔ)音識(shí)別、合成和翻譯的效果,同時(shí)基于其強(qiáng)大的語(yǔ)義理解、知識(shí)問(wèn)答、多輪對(duì)話、多模態(tài)建模能力,也能進(jìn)一步大幅提升智能語(yǔ)音技術(shù)的使用場(chǎng)景和應(yīng)用價(jià)值。
今年1月30日,科大訊飛發(fā)布星火語(yǔ)音大模型,迅速實(shí)現(xiàn)了對(duì)openAI2023年11月發(fā)布的whisper_v3多語(yǔ)種大模型的大幅領(lǐng)先。
6月9日,科大訊飛成立25周年司慶活動(dòng)上,科大訊飛董事長(zhǎng)劉慶峰表示,利用語(yǔ)音合成、語(yǔ)音識(shí)別、機(jī)器翻譯等單點(diǎn)技術(shù),再通過(guò)大模型的理解能力、文本生成能力的后臺(tái)加持,科大訊飛已實(shí)現(xiàn)了語(yǔ)義理解、指令跟隨、多輪對(duì)話、情緒感知、超擬人合成的技術(shù)突破,真正使得語(yǔ)音交互得到提升。
而行業(yè)應(yīng)用,永遠(yuǎn)是技術(shù)生命力的源泉。
在此背景下,語(yǔ)音領(lǐng)域的幾乎所有應(yīng)用,都值得用新方式重構(gòu)一遍:
醫(yī)療導(dǎo)診機(jī)器人、酒店服務(wù)機(jī)器人、所有企業(yè)的客服機(jī)器人等都可以重新做一遍;7*24小時(shí)營(yíng)業(yè)場(chǎng)所的部分崗位、企業(yè)中的服務(wù)類崗位等都可以用數(shù)字員工;汽車、手機(jī)、家庭助手等終端的智能語(yǔ)音服務(wù)也能得到很大提升。
類似的應(yīng)用領(lǐng)域和產(chǎn)業(yè)空間不勝枚舉……
總之,大模型時(shí)代的語(yǔ)音技術(shù),本質(zhì)上是一次推動(dòng)萬(wàn)物互聯(lián)和原有人機(jī)交互場(chǎng)景重構(gòu)的巨大產(chǎn)業(yè)機(jī)會(huì),科大訊飛也正著力抓住其中的核心技術(shù)和應(yīng)用紅利。
創(chuàng)新引領(lǐng),步履不停,6月27日,科大訊飛將發(fā)布訊飛星火V4.0,底座能力將全面對(duì)標(biāo)GPT-4 Turbo,語(yǔ)音大模型也將迎來(lái)全新升級(jí),在科大訊飛國(guó)際領(lǐng)先的智能語(yǔ)音技術(shù)基礎(chǔ)之上,訊飛星火將進(jìn)一步向著“解放生產(chǎn)力、釋放想象力,為每個(gè)企業(yè)和每個(gè)人打造專屬AI助手”的更大愿景。(記者 孟一凡)
編輯: 王莉婷

微信
QQ
朋友圈
更多精彩內(nèi)容請(qǐng)進(jìn)入頻道查看
頭條 政情 地方 微短劇 游安徽 悅讀 播客 萌寵 評(píng)論 發(fā)布會(huì) 記者幫 安徽號(hào) 社會(huì) English 時(shí)局 生活 視頻 好人 專題 原創(chuàng) 版權(quán) 教育 汽車 徽商 圖片 鄉(xiāng)村振興 科技