聯系我們

河北快三100期走势图 www.ivopd.icu 市內地址:天津市南開區鞍山西道時代數碼廣場1216室

電話:022-28255806

傳真:022-83699056

QQ: 在這里留言

Email:[email protected]

濱海地址:天津經濟技術開發區泰達MSD-C1座1707室

電話:022-25825289

傳真:022-25825289

Email:[email protected]

從智能語音識別到實時翻譯 搜狗人工智能開啟新翻譯新時代

從智能語音識別到實時翻譯 搜狗人工智能開啟新翻譯新時代

在語音實時翻譯這件事上,搜狗率先實現了歷史性突破,質量幾乎達到專業同聲傳譯水平。11月17日,在烏鎮舉辦的第三屆世界互聯網大會上,搜狗CEO發表題為《人工智能的未來之路》的演講時,其中文講話內容在實時語音識別的基礎上,同步翻譯為英文并上屏顯示,引起了全場嘉賓的轟動。
    語音識別+機器翻譯迭代的背后
    語音識別在過去一直是科幻小說的常見場景,盡管在大多數領域,科幻作家的想象力遠遠超過現實。語音識別則是少有的例外,其獨特性不僅僅是因為其迅速取得斐然成果,更因為其背后有更多值得挖據的領域,其中就包含令人生畏的實時翻譯。
從智能語音識別到實時翻譯 搜狗人工智能開啟新紀元
    從概念上來看,語音識別是讓機器通過識別和理解過程把語音信號轉變為相應的文本或命令的高技術。在這一領域,搜狗其實已經有了5年的積累,早在2011年便開始深耕語音識別的搜狗,憑借其得天獨厚的條件:大量的數據資源、龐大的用戶量,以及領先的算法,目前搜狗語音識別準確率已超過97%,識別速度達到了400字每分鐘。技術進步下良好的用戶體驗,也帶來了用戶使用量的提升,搜狗第三季度財報顯示,搜狗輸入法的語音輸入日頻次比一年前增長一倍多,單日語音請求已突破1.9億次。
而機器翻譯則是利用計算機將一種自然語言(源語言)轉換為另一種自然語言(目標語言)的過程。事實上,搜狗輸入法在6.8正式版中就推出了在線翻譯的功能,解決了日常輸入中輸入英文的問題。
    在今年夏天的奇點大會上,王小川首次演示了搜狗的實時語音識別技術,將演講內容同步識別為文字,在屏幕中顯示出來,并在8月3日正式對外發布搜狗知音引擎,三個月之后世界互聯網大會上,搜狗知音引擎再推新功能,在識別演講內容的同時進行實時翻譯。
    不過,大多數人都不知道這些突破從本質上說都是同一突破。它們均通過一種名為深度神經網絡的人工智能(AI)技術來實現。
深度神經網絡最值得注意的地方是,沒有人編制出計算機來執行上述的任何技術功能。事實上,沒有人能夠做到這一點。相反則是,編程人員給計算機引入學習算法,給它提供海量的數據(如大量的語音樣本),進而對其進行訓練,讓它自行理解如何去識別物體、單詞或者句子。簡單來說,這種計算機有自學能力,相當于用軟件自己編寫軟件。
    神經網絡并非新概念。該概念可追溯到1950年代,而許多重要的算法突破是出現在上世紀末。不同于當時,如今的人工智能研究者終于可以同時利用強大的計算性能和海量的數據(遍布于互聯網的圖像、視頻、音頻和文本文件),這兩點對于神經網絡的良好運作必不可少,目前,搜狗輸入法PC 端用戶規模在中國排名第一,無線領域排名所有應用的第三位,其中第一、第二分別為騰訊的微信和 QQ;同時搜狗搜索目前在 PC 端排名第三,移動端已經上升到第二。在強大的計算性能和海量數據方面,搜狗有著不可多得的優勢。正如業內人士所評價,“這是搜狗深度學習的寒武紀生命大爆發?!?br />   “機器同傳”的突破與創舉
由兩名到三名譯員輪換進行不打斷講話者講話的情況下的同步翻譯,與會嘉賓同時佩戴同傳耳機,已成了大型研討會和國際會議的標配。但是,人在進行同聲傳譯時,受限于記憶力、聽說速度有限等因素,存在丟失細節翻譯、翻譯的結果無法立刻轉成文字等缺點,此外由于時間限制和領域特殊性,翻譯質量也會大打折扣,同時同聲傳譯人員的費用也非常高,因此如何使用機器進行自動語音實時翻譯也是科學研究期望攻克的難題。
    從智能語音識別到實時翻譯 搜狗人工智能開啟新紀元
    在這次世界互聯網大會上,也為嘉賓配備了同聲傳譯和同傳耳機,但是當王小川說到“搜索的未來就是人工智能時代的皇冠”時,屏幕上實時顯示出了語音識別的中文以及“In the future, search will be the Crown of the AI Era”……在王小川的演講中,機器還能隨著語句的逐漸完整,根據語義自動修改調整之前識別的內容,斯坦福大學杰瑞·卡普蘭教授等外賓們紛紛摘下了同傳耳機,開始感受這不同尋常的“機器同傳”。
    這是全球首次基于神經網絡的實時機器翻譯技術在大型活動上的展示,從現場演示效果來看,搜狗語音識別準確率已超過97%,機器翻譯準確率達90%,已接近人類同傳翻譯結果。
從智能語音識別到實時翻譯 搜狗人工智能開啟新紀元
    為什么會是搜狗首先實現了這一重大突破?據悉,搜狗機器翻譯融合了業界領先的端到端神經機器翻譯技術以及基于實例的翻譯技術,使用的端到端神經網絡翻譯模型通過編碼端獲取源端句子的分布式表示,利用注意力模型聚焦源端,使用循環神經網絡生成翻譯結果,翻譯的結果比傳統機器翻譯更加流暢,效果更好。在近期人工評測中,搜狗機器翻譯在演講、旅游、閑聊、日??謨锏攘煊?,采用五分制人工評分能達到4.4分,走向實用化。
    搜狗在人工智能上較深的技術積累,根源上與其作為一個搜索公司對技術的多方面應用不無關系。無論是大數據的運用,還是對深度學習(深度神經網路)的應用,都超出其他類型的公司。正如Google已經將自己的未來定義成了一家人工智能和機器學習公司,在未來,技術走多遠,搜狗的業務就能走多遠。
此外,傳承文化、促進交流,打破語言對人們溝通交流所造成的障礙或壁壘也是搜狗一直以來的使命。從數據來看,目前全球有50%的互聯網內容是英語,但只有20%的人掌握英語技能。即使是目前的智能翻譯系統只包含8種語言,也覆蓋了全球33%的人口。
    可以說,搜狗長期深耕技術和產品所積累的海量數據以及在人工智能技術上的沉淀都為語音實時翻譯技術的成功奠定了堅實的基礎。搜狗語音實時翻譯技術基于大數據和深度學習,涵蓋了搜狗自主研發的語音識別、機器翻譯兩項重要技術,搜狗語音實時翻譯代表著這兩大技術在實時性和實用性上邁出了較大的一步,并且高效的結合了起來。
    據介紹,在實時性上面,中文結果實時顯示,搜狗的準確率和響應速度穩居行業首位,實時反映英文的結果理想的將延遲控制在了2秒以內。在流利度方面,搜狗語音翻譯采用基于語義的斷句模型來斷句,斷句更加合理,翻譯結果更加完整和流暢。在表現力上面,搜狗語音實時翻譯技術同步顯示聽寫的中文結果和翻譯的英文結果,既可以通過屏幕顯示展示給觀眾,也可以通過手機軟件發送給觀眾。報告結束可立刻生成雙語對照演講文稿,方便后續整理和報道。
    對于實時翻譯的未來,搜狗還有很多工作要做,但是搜狗語音實時翻譯代表著一個重大里程碑。繼續前行,搜狗會進一步優化語音實時翻譯的性能和效果,帶來更加驚艷的機器同傳產品。甚至,從語音識別走向生成再到思維決策,在技術改變生活的道路上,搜狗還會創造新的更多的奇跡。

? pk10三分钟赛车计划软件 北京pk赛车软件下载 玩牛牛赢钱口诀 天天快3计划软件免费 11选5计划软件超强版 时时彩双面盘网站 2019年篮球世界杯直播 新龙虎下载平台 pk10免费计划软件下载 番茄时间管理软件 跑马计划手机版 时时彩人工计划软件安卓免费 最新打鱼棋牌游戏 福利彩票投注站佣金 香港赛马会原创无错36码554 手机投注什么时候停止的