對話介面 – 語音識別技術
對話是生活中的一部分。但是計算機也能進行對話嗎?嗯,在過去的幾十年裡,計算機和人類已經開始透過語音識別和語音合成技術相互互動。被稱為“對話介面 (CI)”,我們將探討這些介面是如何演變的,以及各種型別和當前流行的最新介面。
背景
人類和計算機最初透過“終端介面”相互互動。他們使用命令列或 DOS 提示符。但是由於缺乏語法知識,它並沒有發展成為主流語言。接下來是“圖形使用者介面”,其中包括視覺影像、檔案、操作,使互動更加容易。但它也沒有持續太久,因為這些代表了抽象。現在出現的則是“對話介面”。顧名思義,人類使用自然語言與機器互動,使它們更具感知力、熟練度和可訪問性。
對話介面 (CI)
CI 只是模仿與人類對話的使用者介面。存在兩種型別的介面——語音助手和聊天機器人。語音助手的示例包括蘋果的 Siri、Windows Cortana、微軟 Office Tay、Google Now 和亞馬遜 Echo (Alexa),它們風靡全球。亞馬遜的 Echo 可以調暗燈光、播放音樂、訂購披薩等等。人們只需說話就可以進行搜尋或收聽歌曲。由於它們可以儘可能自然地與人類對話,因此顯得更加個性化。聊天機器人,如 Facebook 的 M、Slack 的 Slackbot、Slack 的 Howdy 等,可用於預訂、下訂單等。
在這些介面上,隨時可用、資訊整理和共享變得容易。其他活動,如線上購物、叫車等也變得更容易,例如虛擬旅行代理 Pana、線上購物應用程式 Operator 等。CI 尤其有利,因為它們可以在筆記型電腦、智慧手機、智慧手錶等裝置上執行。此外,它們可以與其他平臺整合,如 Snapchat、Twitter、Facebook 等。語音識別技術的另一個例子是中國流行的搜尋引擎百度 (DuEr)、微信或最新的 Deep Speech 2。百度處理諸如天氣、汙染水平等查詢。
此外,聊天機器人有兩種不同的型別——基於人工智慧的聊天機器人和基於規則的聊天機器人;或者它們可以是基於文字的或語音控制的。第三種偽聊天機器人可以歸類為微軟的 Clippy 和 Quartz 的簡訊應用程式。在這裡,視覺效果與聊天機器人的相同,但無法像聊天機器人那樣進行對話。像 Adrian Zumbrunnen 和 uxdesign.cc 這樣的網站也可以被視為 CI。
CI 也在業務中發揮著作用。例如,房地產。使用者可以點選網站搜尋房屋,並與聊天機器人互動,獲取所需的所有資訊,同時獲得相關答案。CI 更多地使用文字(單詞)、內容,並使對話與使用者順暢進行。需要牢記的一個重要方面是,使用 CI 時,資訊流應該清晰。使用者必須理解對話並確認他們的理解。必須保持連續性,儘可能自然,並專注於個性化。動畫對於聊天機器人來說也很重要,可以提高滿意度。
爆炸式增長
CI 已經存在多年,但現在正在數字領域趕超。它們與 GUI 徹底不同,因為它們使用文字,提供更好的體驗。CI 中的互動模式本質上是對話——書面(Facebook M)、語音(亞馬遜 Alexa)或混合(Siri/Cortana,因為響應可以是語音或文字)。最後,CI 傾向於提供選擇來選擇回覆。冒險遊戲是 CI 的一種形式,但由於它們難以學習,GUI 取而代之,最終讓位於稱為 CI 的文字互動。現在,由於移動連線、物聯網裝置、社交網路平臺、訊息傳遞世界和基於雲的人工智慧驅動的應用程式,所有這些都為 CI 的興起提供了理由。但當然,企業需要了解其願景和戰略、社交媒體中的存在、底層流程和指標以及在加入潮流建立 CI 之前所需的支撐。
現在,全球 CI 的爆炸式增長是由於競爭和創新。企業需要領先於競爭對手。透過 CI(如聊天機器人),可以實現即時幫助和資訊收集。此外,CI 瞭解所說的話,並準確地猜測消費者的需求。但有時,人們不會以直接的方式說話,這會導致詢問的問題和得到的答案之間存在差異。但是,Normalizer 就是這樣一個應用程式,它在一定程度上解決了縮寫、俚語等問題。
CI 必須理解自然語言並做出同樣自然的回應。其他非常流行的聊天機器人包括美國諾德斯特龍 (購物)、透過 Facebook Messenger 分享航班資訊的 KLM、擁有特定快捷方式或特定操作按鈕的應用程式 Telegram,或允許透過 Slack 訂購玉米餅的 Taco Bell。谷歌正在透過 CI 更進一步;從個人層面上看待互動。正如 Sundar Pichai 所說,“我們正在發展搜尋,使其更具輔助性 [並且] 希望使用者能夠與谷歌進行雙向持續對話,以幫助他們在現實世界中完成任務。我們認為這是為每個使用者構建他們自己的個性化谷歌。”(麻省理工學院技術評論)。
優勢
CI 提供了諸如即時性(響應迅速且量身定製)、普遍性(CI 透過對話或打字隨時可用)、真實性(品牌提供儘可能個性化的答案)和轟動效應(品牌可以在接觸更大群體時創造故事)等優勢。所有這些都有助於提高企業的忠誠度和客戶滿意度。
人們正在認識到,CI 將極大地幫助世界各地的視障人士,因此必須將其視為一種非常智慧的交流媒介。
自然語言介面正在不斷發展,品牌/企業在使用 CI 的同時,可以保持領先地位。隨著時間的推移,CI 將學習/瞭解使用者的喜好、習慣和日程安排。它們最終將成為我們自身的一部分。