當前位置:菜譜大全網 - 菜譜 - 充滿語音的未來是什麽樣子?

充滿語音的未來是什麽樣子?

互聯網er的早讀課

80萬互聯網同行關註!

專註產品運營設計精選內容!

作者:李?秤?/p>

來源:簡書

編輯:妮子小菇涼

城市未變,生活變了

壹、語音發展現狀

語音是很多剛剛想涉足人工智能領域的人所忌憚的,因為從多個角度來說,語音的發展進程較為波折,有幾個現狀:

1.語音方面的技術比較難實現,預處理過程比較復雜

2.語料庫不充足,研究的人少

3.各方面開放的資源就相對稀缺,發展起來也就更加緩慢

現在移動互聯網時代還是人們生活的主要解決問題的方式,而媒介是手機,使用界面來傳遞信息的,這幾年人們已經習慣這種方式,突然之間換到沒有界面,傳遞信息相對單壹而且緩慢的語音方式,就會有很多抵觸的地方,使用起來感覺很奇怪,讓不少產品橫屍街頭。

人工智能雖然被大力支持,但開始的時間還較短,人才供應難以滿足企業的需求,企業想要短時間內可以將技術產品化的成熟工程師,消耗的財力物力巨大,處於轉型階段的工程師,或者讀相關專業的學生還不足以達到這個標準,語音尤為明顯,所以市場上處於壹個浮躁,焦慮的狀態。

二、語音是人工智能的入口

但是意味著語音會在發展中慢慢淡化,甚至只能成為壹場泡沫麽,我認為不僅非但如此,語音才是人們接受人工智能真正的入口,而且也是將來應用範圍最平常,也最廣泛的場景。現在的界面給了人們挑選的空間,多樣性,信息輸入的多樣性,但是人們越來越受其影響,效率低下,疲於選擇,易於沈迷。

就上面,我分開而談。

1.為什麽說語音是入口?

如果妳問壹個普通人,妳認為在壹張圖片中檢測出車牌號,手機APP給妳推送妳最喜歡的新聞,商品,這是人工智能麽,他可能也說不清楚是與否,可能他都沒有察覺出這些變化,但是妳要問他,機器像和人壹樣對話,是人工智能麽,他會毫不猶豫的肯定,因為說話是判斷壹個人最直觀,也最自然不過的方式,人們不懂算法,也不懂數據,就知道我面前的這臺冷冰冰的機器能和人壹樣與我交流,在交流中為我服務,那就是智能,所以,語音是最合適的入口。

2.為什麽語音的應用場景會是將來最廣泛的?

隨著對模型的不斷訓練,醫院可以通過掃描過大量圖片的機器判斷疾病,警察可以通過人臉檢測判斷嫌疑犯,金融可以通過相關算法預測股票,但是語音最合適的場景卻是貼近人們再平常不過的生活,教育,法律,生產雖然都會加入語音,但是機器真正解決人們需求的關鍵點並不在此,它放在具體的這些領域就是換了壹種輸入輸出方式,其實是可有可無的,但是在普通人的生活中,可以隨著語音在各類場景的全覆蓋,經過長時間的體驗,適應,改變解決問題的方式,會潛移默化的讓人們從屏幕上解脫出來,擺脫地點的限制,隨時隨地用最直接的方式接收輸出信息,控制生活的壹切,最終享受於只要說話就可以解決生活很多問題的狀態。

三、語音的未來

再向前進壹步想象,語音的普及狀態會是什麽樣的,那將會是壹個萬物互聯的社會,最近總頻繁聽到這個描述著未來的詞,那麽怎麽壹個互聯的方式呢?泛泛而談比較抽象和枯燥,也有點壹直給語音打廣告的嫌疑,那我用妳將來平常的壹天說說這個用語音互聯起來的生活。

語音引領萬物互聯

1.智能音箱喚醒熟睡的人們

未來的壹天,早上六點整,智能音箱叫醒還在熟睡的妳,妳隨口詢問今天的天氣情況,報告天氣後,它順便提醒妳今天是冬至,別忘了吃餃子,妳們簡單的探討了壹下什麽餡更好吃之後,讓音箱在附近的飯店定了壹盤水餃外賣,並備註讓店家40分鐘後送來,因為跑步是妳每天要做的事。出了門妳戴上配套的智能耳機,喚醒了助手,讓他放幾首平時愛聽的歌。跑著跑著,看見幾只小貓在公園裏,忍不住去逗逗它們,竟忘記了時間,耳機提醒,還有5分鐘外賣就要送到了,妳開始往家跑,還是遲了,外賣小哥打來電話,用耳機直接接聽後,叮囑他放在門口。回到家,摘下耳機,洗漱過後,喚醒了音箱,讓它播送最近的新聞,壹邊聽,壹邊吃餃子,口令換了幾個頻道,沒有什麽感興趣的,就關掉了。

2.車載語音助手陪伴上班

吃飽後,開車去上班,上車後喚醒了車載語音助手,讓它給自己導航現在不堵的路線,畢竟是早高峰。剛要啟動,突然想起家裏的燈沒關,就讓助手趕緊把家裏的燈關了,並讓它檢查了壹遍還有什麽沒有關,確認無誤後,安心上路。開了壹會,車載助手提示妳有人給妳發微信,妳讓它把內容念壹下,原來是在家讀書的妹妹今天過生日,忙於工作的妳竟然忘記了,就讓助手選壹只價格在200元左右的鋼筆,選好顏色後,助手把圖片發到了車載屏幕上,感覺不錯,就口令支付購買了,然後讓助手給妹妹發壹條“給妳準備了壹個小禮物”的回復,算是有驚無險。

3.辦公室音箱幫助工作

到了單位,喚醒辦公室的音箱,詢問了壹下妳今天有幾個任務要完成,怕自己偷懶,妳讓它給妳為每壹件事設定了完成的時間,到時提醒。其中有壹件是妳需要給其他的同時發郵件,妳就直接壹邊想內容,壹邊說給助手,讓他給同事發去了,省去了界面切換的繁瑣步驟。正在埋頭苦幹,領導突然讓下周去外地出差,於是急忙讓助手訂壹張前壹天的機票,同時訂了壹家機場旁邊的酒店,簡單選擇好房型,價格後迅速預訂,繼續工作。中午吃飯回來,老板通過助手叫妳們開會,妳們壹邊聽,壹邊交流,效率很高,會議室的助手已經把會議記錄轉寫了文字,發到了郵箱裏,不用擔心錯過或者忘記什麽內容。

4.語音助手助妳入眠

下班回家,出了公司,戴上耳機,詢問了下給妹妹買的鋼筆發沒發貨,順便讓助手把家裏的熱水器打開,操作和等待變成了壹句話。開車到了家,壹個人的生活難免比較無聊,就習慣了叫助手陪著聊會天,他什麽都知道,也會給妳打開壹些工作中的心結。聊著聊著,心情不錯,讓它看看冰箱裏有什麽菜,給妳推薦了幾個對應能做的菜譜,選了壹個簡單的,它壹邊念,妳壹邊做,並貼心的放起了平時愛聽的歌,別有愜意。睡覺之前,和它交代了壹下明天的工作任務,就睡了,明天又是重新開始的壹天。

四、語音未來的應用平常而廣泛

故事講述起來是平淡無奇的,但是這平淡無奇的壹面就是大多數人生活的樣子,而語音在這種平淡無奇的生活中,才能發揮它的極大價值。(故事沒有描述快遞是無人車送達,吃飯的服務員都是自動化餐桌或者機器人服務員,樓道裏的清潔人員已經是掃地機器人,公司或馬路上配備的自動診療儀可以隨時檢查身體狀況,我們主要說語音的應用)。

通過故事可以看出,雖然只是壹個普通的上班族,在使用語音設備為其服務時,都會包括但不限於上面提到的,物流,外賣,電商,記事,提醒,發信息,導航,讀文本,家居,閑聊,聽歌,接聽電話,支付,新聞等等眾多領域,我們總說互聯網應用場景的豐富給了人工智能更多的發展空間,但正因為應用場景多了,要想滿足人們生活裏再平常不過的需求也變得不那麽容易,壹旦場景的豐富度不夠,那麽體驗效果就會有所下降,如果硬件環境不能隨著場景壹起覆蓋,不能完全發揮語音的便利性,所以語音的這條路還要有很多事情要完成。

我們借用語音的意義就在於增加我們解決問題的效率,多樣性和趣味性,不是刻意的使用語音,而是在隨時想要快速完成壹件事情時,只要自然地,習慣性地說壹句話,就可以解決,而這需要機器將前期工作做到極致,也需要搭建起軟硬件豐富的生態圈。

五、語音應用尚需攻克的難題

故事裏有幾個現在在技術和產品設計上都尚需攻克的問題:

1.如何將多種硬件(耳機,音箱,家電)互相之間建立聯系,彼此控制,軟件是互通的,並且實時在更新內容

2.如何實現用耳機,音箱可以長時間,遠距離語音聽寫,同時還要設計好隨時刪除,修改的功能

3.如何預定各種票務,購買商品

4.計算機用算法篩選商品不是問題,怎麽以用戶最方便的方式接收到結果

5.如何根據用戶壹段時間的生活習慣,主動為其推送消息,或者主動服務壹些功能,以什麽形式,什麽時間點呈現?

6.機器能否實現同時並行的做兩件或者以上的事(放音樂,說菜譜)

7.閑聊時候不能總是用兜底回復的方法,如何解決百科問題,專業問題,甚至情感上需求的問題,態度中立,理性分析,這可能不只是技術上的事

8.由於場景的多樣性,不能壹直處於喚醒的狀態,如何在沒有喚醒的狀態下也能提醒用戶日期,日程,新消息等信息

9.如何做到擺脫界面的支付,同時具有較高安全性

10.如何控制說話的信息量,說話節奏,語速,音量,才能讓用戶不會排斥

11.說出去的話,潑出去的水,語音這種即時性的使用方式,如何設計才能給用戶以確認的時間。提示?還是重復?

六、結語

語音因為受眾面是每壹個普通人,所以對於產品的體驗要比其他方向更看重,反倒對技術的精準性達到人們滿意的程度就好,這樣對交互設計師,產品經理的要求也就更高。

帶著上面這些問題,接下來我對現在AI各公司的應用,芯片,開放平臺等布局進行總結以及分析,看看哪些問題已近解決,那些仍有很長壹段路要走,哪些更側重於技術,哪些更側重於設計,這對於各公司找準定位,競品,發展方向,找到解決問題的思路都有壹定益處。

投稿郵箱:

本文由簡書李?秤鈐?矗?諶ɑチ?綞量巫?亍D諶萁齟?磣髡叨懶⒐鄣悖?淮?碓綞量瘟⒊ H縲枳?兀?肓?翟?髡摺?/p>