搜尋本站文章

2012年9月24日 星期一

英特爾感知計算開發包:可讀唇語,改變人機互動!

9 月 24 日消息,據國外媒體報導,英特爾在最近召開的 IDF 大會(英特爾開發論壇)上正式推出了感知計算軟體發展工具組 2013(Perceptual Computing SDK 2013)測試版。這種 SDK 是説明開發者開發應用程式,使使用者通過將語音和機器視覺與鍵盤、滑鼠,直接觸控式螢幕結合起來的多模式介面,實現與計算裝置的互動。

這種技術不但可能從根本上改變使用者與手機、平板電腦和 PC 互動方式,而且是英特爾未來發展的關鍵,因為其需要耗費大量的計算資源,對英特爾的未來非常重要。今天,使用者通過無數方式如直接觸控式螢幕、鍵盤、滑鼠和觸控板,與計算裝置如手機、平板電腦和 PC 互動。當我們看到微軟通過 Kinect 和蘋果通過 Siri,對機器視覺和語音控制的早期投資,可以發現要改進使用者體驗還要做很多事情。

語音辨識、機器視覺被廣泛使用子軍事領域,從 9 / 11 後因政府的資助過去十年獲得顯著發展,但還沒有成為平常的主流應用。語音辨識的出現已經有很長時間,很多舊版和新版 Windows 都預裝了,但卻從未真正成功,因為其從來就不是真正的自然互動而且也不准確,尤其還需要使用耳機。

只有在蘋果 iOS 和谷歌 Android 平臺上,語音辨識才得以發展,但仍然不足以精確到可以不要鍵盤,而且還需要連接到互聯網才正常工作。XBOX Kinect 語音交互的神奇在於其有限的詞典,即「說你看到什麼」的方法、雙麥克風和「波束成形」。微軟的方法在遊戲環境中使用不錯,但在需要跨不同設備進行廣泛使用時還是不自然。

機器視覺是最近通過微軟的 Kinect 才流行起來。Kinect 使用了兩個攝像頭,但不能準確地檢測特定手指和關節。雖然處理是在攝像頭和 XBOX 上完成,但使用者必須呆在房間裡的某個地方,而遊戲僅限於需要最少計算資源的不復雜遊戲。

一些電腦製造商甚至谷歌的 Nexus 7 提供了面部識別功能,但這些功能都很慢而容易被圖片、視頻或面具所愚弄。除了電視外,對於大多數計算環境這都是不可接受的。

怎樣才能使介面更自然?首先,需要以非常低的功耗使用大量本地計算性能才能使用自然使用者介面。讓我們用保護使用者登錄安全的機器視覺為例。最好的方法是要有兩個高解析度攝像頭,繪製人臉的三維視圖。可以把這看作是 3D 遊戲的逆向工程。3D 機器視覺不是顯示遊戲的圖元和紋理,也是將這些多邊形和紋理輸入計算裝置。挑戰在於,這需要大量的處理性能和大量的電力,不僅是計算引擎而且還有高解析度和立體攝像頭都需要。

然後,3D「圖」需要與本機資料庫的圖案匹配,這需要更多的計算性能和電力。這個步驟被叫做「物件識別」,設備需要判斷誰在看。雖然這種安全的、面部識別登錄只是一個例子,但這種自然使用者介面潛在用途還有很多:
  • 在商務會議上主持人可使用手勢來移動幻燈片,而不需要「點擊」。他們只要搖動下手。 
  • 手上沾有麵粉的廚師在看食譜時,只要揮下手就能翻頁。 
  • 服裝設計師可使用自己的雙手、手臂和軀幹,穿戴電腦設計的一對墊肩。 
  • 通過識別聲音的語調,家庭電腦就知道在你煩惱時避免讓你分心。你回家時就可享受柔和的音樂和暗淡的燈光。 
  • 當聽到恐慌的聲音時,你汽車上的電腦就知道你有麻煩了,然後問是否要打 911 報警。 
  • 你的家庭電腦感覺有其無法識別的人在用你的電腦,就會通過短信發送該人的照片。 
  • 在療養院,租戶電腦能知道療養的人整天沒有起床,就會通知護士或家庭成員。 
  • 通過結合語音、文本和唇讀,聽寫達到近 100% 的準確。
  • 在你告訴孩子只有 2 個客人後,如果房間裡出現 5 個人,電視能識別並向你發出警告。 
  • 「手滑鼠」取代實物滑鼠或觸控板,手可以在螢幕的任何地方點擊和揮動。攝像頭可即時拍下你的手、關節和指尖。 
  • 會議記錄可記錄會議上的所有東西,並按不同的人分開記錄。動作和「停頓」都是自動「感知」。
 這些非常個人化的例子都需要隱私控制,英特爾在 SDK 加入了「隱私通知」。當指示器顯示當你正在被麥克風或攝像頭記錄時,這變得很簡單。

如果說語音和機器視覺都不是直接觸摸觸控板和顯示器,鍵盤和滑鼠將很快消失,就錯了。我們將轉到「多模式」介面,設備將根據環境和使用者歷史選擇最好的控制方式。這就是英特爾的「使用模式協調」,可選擇最好的互動模式。另外,在需要協調時可同時使用兩種不同的模式。唇讀可以與語音、文本結合,從根本上改善語音互動。

我們什麼時候可以實現?英特爾的感知計算計畫是一個長期的計畫,逐年看到性能和可交付成果的進步。今天,攝像頭還太大,要一直使用需要太多電力。即使系統匯流排和 USB 都需要太多的電力,很可能被移動匯流排如 MIPI 取代。隨著時間的推移所有這一切都可以解決。除了英特爾外,將會有很多不同公司爭奪領先地位,因為這是非常關鍵的領先優勢。

英特爾處於有利的位置,因為該公司具有很大的規模、影響力和力量,是英偉達之外唯一跨越從智慧手機到超級電腦晶片的公司。如果英特爾可以成功地領先行業,需要在一開始就有大量的高性能晶片,而這正是英特爾的優勢。對英特爾來說時間是最關鍵的,因為該行業已經一次又一次看到該公司投入了大量的時間和精力,在移動晶片的視頻編解碼上,為縮短差距需要固定功能或半可程式設計晶片。

===============================================
創用 CC 授權條款
Related Posts Plugin for WordPress, Blogger...

沒有留言:

張貼留言

1、本留言處歡迎多加留言交流,但不歡迎垃圾留言及廣告留言
2、留言時可以使用部份 HTML 標記
3、對於教學文章介紹或軟體使用有問題歡迎提出,若站長沒回應表示不清楚該問題的解決方案
4、留言時請勿留下電子郵件,以免因搜尋引擎爬文而造成您的困擾,且站長不會寄相關郵件給您,僅會在留言區提供解決方案
5.站長保留不當刪除留言的權力,若造成不便尚請見諒