日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

语音交互设计的一点认知

發布時間:2024/3/12 编程问答 45 豆豆
生活随笔 收集整理的這篇文章主要介紹了 语音交互设计的一点认知 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

語音用戶界面(或VUI)是一種交互模型,在該模型中,人與機器進行交互,并至少部分通過使用語音來執行一組任務。

實際上,這種方式的交互式語音應答(IVR)系統在銀行業和旅游業中已經得到了廣泛的應用。這些系統主要依賴于語音生物識別來識別用戶并使用語音作為主要交互模式完成的任務集。隨著亞馬遜Echo、蘋果的siri 等產品的誕生,VUI發生爆炸,各大公司也開始嘗試多媒體交叉設備的體驗。

“治學先治史”,了解語音技術的過去點滴,大概會有些幫助。

穿越時間走廊

早在1961年,IBM設計了一個名為Shoebox的實驗裝置,是由William C.Dersch開發的,大概是早期的語音識別設備。機器把聲音轉換成電脈沖可以識別出16個單詞。在1962年西雅圖舉行的世界博覽會上首次展示,這可能是自動語音識別(ASR)和自然語言理解(NLU)的起點,但只涉及第一部分的聲音識別。對于純語音用戶界面,機器生成人聲早在1939年或更早的時候就有了。

霍默·達德利(在新澤西的貝爾電話實驗室)的Voder是第一款能夠產生連續人聲的電子化設備。1939年,阿爾登·P·阿瑪涅克在《大眾科學》雜志上寫下了關于這一裝置的文章。它是用真空管和電路制成的,是為了復制人類的聲音。為了進行對話,機器操作員使用了一個像風琴一樣的鍵盤。十三個黑白鍵產生了所有的元音和輔音,另一把鍵控制著合成聲音的揚聲器響度。腳踏板改變了音調,使同一句話可以陳述句或疑問。大約一年的培訓,操作員就能使機器說話,想起來也是一個有意思的東西。

2000年初,IVR系統成為主流。任何有電話的人都可以預訂飛機航班,在賬戶間轉賬,查找當地電影時間,聽交通信息,所有這些都只使用普通電話和人聲。

語音交互、增強現實和虛擬現實等技術或許已經存在或研究了相當長的時間。令人興奮的是,它們最終在市場上廣泛商用了,這就需要設計師和工程師來承擔開發場景以解決用戶日常問題的挑戰。

為什么是語音助理

語音助理已經風靡各地,為什么呢?它的優勢有:

  • 自然

  • 解放雙手

  • 快速響應

  • 個性化

語音是人們交流的基本手段。其他形式的交流方式如寫作、面部表情或手語,在所有文化中也都同樣具有表達力,但人們主要還是通過語音來說服、告知和建立關系。語音助理能夠在不同的場景和渠道中保持一致。

理解對話

用戶通常會就手頭的特定任務進行語音對話。交互通常很短,來回的交互也很少。用戶可以通過對話來完成一項任務,即使他們不忙,不能總是全神貫注。用戶在通過GUI執行相同任務時會感覺到很多延遲或不爽,而對話將有助于減輕這種體驗。

在語音識別中,得到對話所有的上下文幾乎是不可能的。上下文大約分成三類:

  • 物理上下文

  • 情感上下文

  • 對話的上下文

從物理、情感和會話上下文中,可以創建一個關于會話內容的推理或得出結論,得出一個擬人化的結果。

對話的意圖大約有兩種,一種是目標反饋確定的,一種是不確定的,對于不確定的意圖需要更多的用戶選擇。也就是說,大約可以分為基于意圖的對話和隨機問答。基于意圖的對話是為了完成一個目標或完成一個任務而進行的對話。心里有一個意圖,需要助手的回答,這時只想完成一項任務。隨機問答是指用戶與助手進行交互時沒有特定的意圖。他們只是想和助手聊天,談興趣,也許是想更多的彼此了解,建立一種關系。

當然,語音交互有著自己的局限。在IVR中,很難暫停系統,相反,用戶必須不斷地進行交互,而視覺組件可以讓用戶以更輕松的方式繼續交互。另外,是在公共場所使用方面的限制。用戶可能不能在某些公共空間使用語音,因為這樣做會侵犯用戶的隱私。

語音交互的部分關注點

人的一種主要行為,就把人的情緒聯系起來,試圖理解一個復雜的物體。不過,大多數消費者的底線是,更愿意與一個溫暖的身體交談,而不是與一臺冰冷的電腦交談,因而需要關注語音應答的多樣性。

逐步披露是人機交互中常用的一種交互設計技術,通過減少混亂、混亂和認知工作量,幫助保持用戶注意力的焦點。這通過只提供手頭任務所需的最小數據來提高可用性。一般使用猶豫標記,或者增加短語詢問。

給語音助理賦予人性化,可能需要一些因素:

  • 經驗的開放性,這可能包括對藝術、情感、冒險、不尋常的想法、好奇心和各種體驗的欣賞。

  • 責任心,可以是高效/有組織的,或者隨和/無關緊要的態度。

  • 外向傾向于表現為外向、健談、精力充沛的行為,而內向則表現為較為保守和孤獨的行為。

  • 令人愉快的對話,體現善良、同情、合作、熱情和體貼的個人行為特征。

  • 神經質,可能是驚喜,也可能是驚嚇。

模仿的行為可以與另一個人更相似,感知到的相似性可以作為基礎。

基于語音的交互或語音檢測依賴于一個設備,該設備有一個性能良好的麥克風來捕捉/記錄用戶的指令,可以參考過去一篇文字。

多方式交互的HCI

VUI與GUI成為人機交互規范的時候非常相似,設計人員需要清理混亂的邏輯,簡化數據,并向用戶提供更容易掌握的流程和解決方案。以電視遙控器為例,設備上有20-30個按鈕時,操作起來就會非常困難,一個人很難理解所有按鈕的作用。沒有好的設計,技術就很難甚至不可能得到應用。

用戶體驗設計圍繞著整個用戶旅程展開,即回答用戶對特定用例可以做什么,然后理解用戶能夠以無障礙和愉快的方式滿足需求的最佳方式。

從一開始就不能決定只使用一個模態,但是設計者必須理解用戶根據系統的輸入和輸出模態完成特定任務的需求。

對于具有圖形用戶界面的數字助理,當有動畫選項時,這變得更有趣。在這里,助理會表現得像人一樣;會傾聽你的問題,思考,回答,開個玩笑,唱歌,表達悲傷和憤怒,還有很多其他的情緒。

多交互方式并存,形成了人機交互的領域。人機交互(HCI)已經存在了相當長的一段時間了。在20世紀50年代初,用穿孔卡片存儲數據和輸入,隨著個人電腦的引入而發生了顛覆性的變化。20世紀80年代后期,幾乎使世界上的每個人都成為潛在的計算機用戶,也暴露了關于可用性的問題。

HCI整合了認知心理學、人工智能和思維哲學,以闡明系統化和科學化的應用,稱為認知工程。它使具有概念、技能和遠見的人能夠滿足人機交互的實際需求。

交互設計的一些原則

HCI 的設計有很多的經驗和原則,對于VUI同樣有著參考意義。例如,Ben Shneiderman 關于界面設計的8條金規:

  • 爭取一致性

  • 允許用戶使用快捷方式

  • 提供信息反饋

  • 設計對話以實現閉環

  • 提供錯誤預防和簡單的錯誤處理

  • 允許輕松逆轉操作

  • 支持內部控制點

  • 減少短期內存負載

又例如,Donald Norman的七個設計原則:

  • 在頭腦中運用現實世界和知識

  • 簡化任務結構

  • 使事物可見;縮小執行和評估之間的差距

  • 正確繪制地圖

  • 利用自然和人工約束的力量

  • 面向錯誤的設計

  • 當所有其他方面都失敗時,標準化

還有現在廣泛使用的Nielsen啟發式UI/UX設計原則:

  • 系統狀態的可視性

  • 與系統和現實世界相匹配

  • 用戶控制和自由

  • 一致性和標準

  • 靈活性和效率

  • 錯誤預防

  • 錯誤報告、診斷和恢復

  • 美學和極簡設計

  • 識別而不是回憶

  • 幫助和文檔

創建一個平滑無縫且自然的 VUI 對于使用的人工智能產品來說至關重要。對VUI而言,也有著自己的設計技巧:

  • 了解智能引擎的背后,成功與否取決于真正為體驗提供動力的內部架構。

  • 構建自己的設計工具棧,Adobexd非常適合用于線框用戶流程圖,語音工具包括Walkie, Botframe 和 Mockabot等。

  • 個性在設計中表現出來,而不是交給設備。個性表現在設計決策和獨特的工作流程,堅持利益相關者的有效執行。

  • 少即是多。設備所說的實際語言必須清楚地滿足其用戶的需求,剩下的才是措辭,句子結構,音調,甚至聲音本身的音調變化等。

  • 在配音的時候要專業一點。專業的錄制最好有TTS的客戶經驗,為人工智能對話設計音頻與制作音樂甚至是傳統的配音有很大的不同。

  • 在 VUI 之外保持角色的一致性。如果圖形元素不能和諧地補充語音元素,那么創建一個殺手級的 VUI 將被證明是徒勞的。?

  • 讓語音設備保持親密狀態。有競爭力的產品是需要盡可能多地挖掘 。

  • 鼓勵嘗試。場測和錯誤驗證,再加上可靠的用戶研究,無論多么細致,都不會讓你成功地將最微妙的特質融入到你的語音交互體驗中。

  • 一切都是達到目的的手段。歸結為一件事,數據是人工智能的全部。個設計良好的 VUI 應該通過成為習慣的具有啟發性的交互體驗來補充這個過程。

  • 設計的分享。目標、需求、最佳實踐、技術、技術、工具集和行業每天都在不斷變化。知識和經驗的擴散是揭開人工智能個性設計的神秘面紗并使之標準化的最佳途徑。

  • 然而,“大道易得,小術難求”。行勝于言,努力去學習和實踐才能得到更多的理解和認識。

    (本文圖片來自網絡,如有侵權,聯系作者刪除)

    參考資料

    • https://ai.googleblog.com/2018/05/duplex-ai-system-for-natural-conversation.html

    • http://www.speechtechmag.com/Articles/Editorial/Feature/Its-a-Persona-Not-a-Personality-36311.aspx

    • https://www.forbes.com/sites/mnewlands/2017/08/25/10-essential-tips-on-voice-user-interface-design-for-ai/#29f764dc2422

    • https://www.theatlantic.com/science/archive/2017/12/the-secret-lifeof-um/547961/

    • http://www.csun.edu/science/courses/671/bibliography/preece.html

    • Nielsen, 1995, https://www.nngroup.com/articles/ten-usability-heuristics/

    總結

    以上是生活随笔為你收集整理的语音交互设计的一点认知的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。