達摩院在語音智能、語言技術(自然語言處理)、機器視覺、平臺建設三大技術領域取得了豐碩成果。
語音智能方面的成就2065 438+2008年6月,阿裏達摩院開放了自主研發的新壹代語音識別模型(DFSMN),這是全球最大的免費語音識別數據庫LibriSpeech。
對…進行公開測試。與目前業界應用最廣泛的LSTM模型相比,DFSMN語音識別模型具有更快的訓練速度和更高的識別準確率。基於DFSMN模型,阿裏AI有所發展。
在DFSMN-CTC模型中,語音誤碼率大大降低,解碼效率提高了6倍。
語言技術方面的成果是達摩院機器翻譯技術團隊取得的,已經達到48人。
壹個語言翻譯方向,支持俄語、西班牙語、法語、阿拉伯語、土耳其語、泰語、印尼語、越南語等語言;其中,電商覆蓋了大部分語言方向和場景,超越Google和Amazon,日調用量17.9。
十億次。阿裏的機器翻譯技術不僅用於電商全鏈路服務,還廣泛應用於菜鳥物流通關、阿裏雲國際社區、飛豬旅行翻譯助手、釘釘社交口語翻譯等壹系列產品。
機器視覺方面的成績2065 438+2009年7月,在CVPR 2019舉辦的LPIRC(低功耗圖像識別挑戰賽)中,阿裏AI獲得在線圖像分類任務第壹名,時間23 ms
單幅圖像分類速度,10分鐘分類20000幅圖像。在挑戰賽使用的訓練數據集上,達到了67.4%。
分類準確率比官方基線高3.5%。
阿裏·艾
提出了壹種“遞歸探索對話模型”,集成了圖像識別、關系推理和自然語言理解三種能力。通過高效地使用標記信息,我們可以學會模仿人類認知復雜場景的思維模式,有效地識別圖片中的實體及其關系,推斷圖片中描述的事件內容,並有效地對上下文進行建模,以理解人類提出的問題和真實意圖,並給出自然準確的響應。
達摩院到底有多厲害?馬雲說,阿裏巴巴可能沒有,但是達摩院可以留下。從馬雲說的話來看,可想而知達摩院有多厲害。
達摩院的研究方向是未來的市場發展方向和高新技術,短期內可能看不到太大的成果,但壹旦研究成功,變化將是巨大的。