Apple Siri服務能否成為第四次人機互動革命?

2011/12/19
31628
利用 Apple iPhone 4S 正式發表的機會,Apple 向世界正式介紹了 Siri 語音輔助功能及服務,全新 iPhone 5 未出現的失望和隨後 Steve Jobs 去世的巨大悲痛中,讓多數人忽視了 Siri 服務里程碑式的意義,還有人認為 Siri 不過是原有語音控制的加強版。「透過語音與智慧型手機互動」是否成為繼觸控功能之後、Apple 帶來的另一次人機互動的革命?請看手機王網站的分析報導。

Apple Siri服務能否成為第四次人機互動革命?


▲「透過語音與智慧型手機互動」是否成為繼觸控功能之後、Apple 帶來的另一次人機互動的革命?

Apple 強烈看好的未來科技

與容易理解的照相功能相比,另一個 Apple iPhone 4S 加入的功能:整合語音辨識及軟體代理人(Software Agent)科技的「Siri」語音辨識功能顯得十分抽象。語音識別技術並非嶄新發明,早在十幾年前就已經被應用於個人電腦領域,多年前 IBM 研發的語音識別軟體在 PC 個人電腦上已經有不錯的識別率。幾年前車載式 GPS 等產品也擁有語音功能。軟體巨頭 Google 更在一年多以前針對 Android 智慧手機作業系統推出了「語音識別」及「語音搜索」技術。簡單的智慧分析和系統語音命功能的也不算革命性的創新:無論是 Google 推出的 Voice Action、還是 Vlingo 等獨立公司的產品都已經有一定的口碑。

Apple Siri服務能否成為第四次人機互動革命?
▲「語音控制」一直是 Apple 工程團隊關注的方向,但真正突破性的進展還是 2010 年收購了 Siri 軟體公司之後。

「語音控制」一直是 Apple 工程團隊關注的方向,但真正突破性的進展還是 2010 年收購了 Siri 軟體公司之後。在 App Store 上推出了一款備受矚目的語音搜索軟體,讓 Siri 成為許多軟體巨頭的收購目標。不論是 Apple 還是 Google,一旦發現符合其戰略意圖的目標後,經常是以迅雷不及掩耳的速度將其收入囊中。2009 年 10 月,Google 亟欲趁著 2009 年結束前在關鍵領域大舉擴張。該年 11 月 9 日、Google 向美國 NASDAQ 交易所申報將以價值 7.5 億美元股票收購手機廣告科技供應商 AdMob。AdMob 擁有更豐富的廣告格式,許多美國大型企業如福特汽車、P&G 和可口可樂等都是它的客戶,創立至今 AdMob 也從許多國際知名風險投資基金如紅杉資本、Accel Partners、DFJ 增長基金和北門資本等風投公司獲得了超過 4,720 萬美元的融資。美國通信市場內幕人士事後透露這宗收購案甚至是後來 Apple 與 Google 決裂的重要原因之一:其實去年 Apple 也考慮收購 AdMob,並一度與 Google 達成了「不彼此競爭抬高收購價格」的共識,但之後 Google 竟搶先一步出價收購,可能正是這宗收購案促成了 Steve Jobs 下定決心在 iOS 4.0 加入 iAd 廣告平台。

Apple Siri服務能否成為第四次人機互動革命?
▲兩年前 Siri 推出的第一代產品整合了 Nuance 語音識別技術,然後根據語意分析能力理解用戶的搜索需求並向用戶推薦相關的服務,看起來更接近一個手機語音預訂應用。

有了 AdMob 的前車之鑑,Apple 在收購 Siri 團隊時顯得十分果斷。外界傳言 Apple 的收購價碼在 2 億美元以上,考量到 Siri 經過兩輪融資之後的估值超過 1.5 億美元,2 億美元以上的的收購成本並非空穴來風。兩年前 Siri 推出的第一代產品整合了 Nuance 語音識別技術,然後根據語意分析能力理解用戶的搜索需求並向用戶推薦相關的服務,看起來更接近一個手機語音預訂應用。不過當時 Siri 服務已經支持包括 OpenTable 的餐廳預訂、Taxi Magic 的計程車預訂、Showtime 的電影票預訂等服務,以及從 Yahoo!在地生活服務資料庫中搜索訊息的能力。經過 Apple 團隊的大力改進之後,2011年10月 Apple 推出了整合在新作業系統內的 Siri 服務、同時宣佈舊服務於 10 月 15 日停止,成為 Apple iPhone 4S 獨享的功能。

轉移自軍方人工智慧研究計畫的結果

眾所皆知,人機互動介面的革新是 Apple 前任執行長 Steve Jobs 最為關注的領域:早在 Atair 8800 只能用燈泡顯示訊息時,Steve Jobs 推出的 Apple 個人電腦就擁有鍵盤及顯示螢幕,在市場上多數個人電腦產品都只能用鍵盤輸入的時代、Steve Jobs 主導研發的 Apple Lisa 電腦就擁有滑鼠與圖形化操作見面(GUI),最早將觸控功能帶入消費電子市場的廠商也是 Apple(1990 年代推出掌上電腦產品 Newton)、這項功能更在 iPhone 問世後給予了全新的定義。越來越多產業人士將 Siri 視為繼螢幕命令列(鍵盤)、圖形介面(滑鼠),手勢(多點觸摸)之後的第四波人機互動介面革命。這類可能改變世界的科技、Apple 前任執行長 Steve Jobs 從來都不會錯過!

Apple Siri服務能否成為第四次人機互動革命?
▲各類可能改變人機互動介面的關鍵科技、Apple 前任執行長 Steve Jobs 從來都不會錯過!

關於人工智慧研究的研究取源於 1980 年代,但始終沒有突破性的進展。1990 年代之後關於廣義的人工智慧有關的研究(包括自然語言處理在內)仍有持續研究,但研究主題轉為趨向實用領域、尤其是軍方出資的研究計畫。Siri 的前身:人類史上最大的人工智慧項目 CALO(Cognitive Assistant that Learns and Organizes、具備學習和組織能力的認知助理)就是 2003 年由美國國防部高級研究機構(DARPA)所贊助,其目的是研發一個具備理解(認知)能力而且會進行某種程度的學習與分類的軟體系統。2010 年CALO 的研究成果以 Siri 軟體的身份登陸 iOS 平台,而且不僅是侷限在大學實驗室內的超級電腦或是昂貴的軍用的設備,受益於智慧型手機的普及性及可攜性、加上行動上網的成本日漸降低,具有認知與學習能力的隨身智慧型「軟體代理人」(Software Agent)終於到了大量普及的一天。

Apple Siri服務能否成為第四次人機互動革命?
▲ Siri 的前身:人類史上最大的人工智慧項目 CALO(Cognitive Assistant that Learns and Organizes、具備學習和組織能力的認知助理)就是 2003 年由美國國防部高級研究機構(DARPA)所贊助。

傳統搜索引擎感受到強烈威脅

將 Siri 整合進入 iOS 5 系統核心的 Apple 其意圖遠遠不只是簡單的語音識別功能,而是在分析用戶的個人資料、聯絡資訊以及行事曆之後根據語音指令執行任務,強調其扮演「虛擬個人助理」(VPA)的角色。在發表會上 Apple 展示了多種人機對話場景:包括管理日程安排、尋找餐館以及查詢天氣。隨著 Siri 應用領域越來越廣泛,整個網路搜索產業(尤其是搜索巨頭 Google)都切身感受到 Siri 改變搜索使用模式之後帶來的巨大威脅。長久以來用戶使用網路搜索引擎的傳統模式為:打開網路流覽器 → 前往搜索引擎主頁 → 輸入欲查詢關鍵字 → 搜索引擎返回搜索結果 → 在一堆搜索結果中尋找最適合的資訊(取決於設定搜索關鍵字的技巧)。Siri 未來有望成為行動搜索的「門戶」,所有的應用程式和網路服務都將隱身其後,使用流程大幅簡化為兩步:與 Siri 直接對話 → 得到結果。具有認知與學習能力的 Siri 包辦了語音識別 → 進行智慧分析 → 瞭解用戶意圖 → 啟用本地應用或者網路服務的 API → 整合所有結果並將最合適的內容呈現給用戶。

Apple Siri服務能否成為第四次人機互動革命?
▲受益於智慧型手機的普及性及可攜性、加上行動上網的成本日漸降低,具有認知與學習能力的隨身智慧型「軟體代理人」(Software Agent)終於到了大量普及的一天。

雖然 Apple 不斷強調 Siri 並不是搜索引擎,但整合語音識別, 人工智慧與網路服務之後,Siri 的重要性比單純的搜索引擎更高、用戶使用 Google 服務的機會也可能大幅降低、進而剝奪了 Google 獲利機會。Google 的業務模式為分析全球的網路資訊與內容,然後以此為基礎銷售廣告。因此 Google 提供的服務多為免費,主要包括了三大類別:搜索(Search)、瀏覽(Explorer)與通信(Communication)功能,而最為人所熟知的當為搜索功能。Google 從獨霸搜尋引擎開始,每筆搜尋結果的數據也都會回傳給 Google 的資料庫,這使得該公司掌握了關鍵核心價值:消費者的偏好(Preference)。隨著 Siri 大幅降低了 Google 搜索引擎的使用機會,預料 Google 也將於短期之內推出類似服務以進行抗衡。

Apple Siri服務能否成為第四次人機互動革命?
▲隨著 Siri 應用領域越來越廣泛,整個網路搜索產業(尤其是搜索巨頭 Google)都切身感受到 Siri 改變搜索使用模式之後帶來的巨大威脅。

開拓亞太市場存在難度

產業人士目前對 Siri 功能是否足以吸引用戶購買 Apple iPhone 4S 仍未有定論(過去的歷史經驗表明使用者不太看重該類科技),對於顧客群遍及全球的 Apple 來說,仍未對非英語系國家開放(初期僅支持英語、法語和德語,其中英語支援三種口音:美式、英式和澳大利亞口音)的 Siri 也遠遠稱不上完美。大中華地區使用者最關心的應該是 Siri 何時能夠支持漢語(北京普通話)?身為世界上最難、最特殊的語言之一,各式漢語對聲音的依賴非常小,這就為什麼普通話、粵語、閩語等等這些方言的發音完全不同卻仍然可以使用相同的漢字無障礙交流的原因。另一個挑戰在於漢語的同音字同音詞太多,而且並無固定語法(例如「白天鵝在游泳」究竟是「白天 / 鵝在游泳」還是「白天鵝 / 在游泳」)。這將對 Siri 系統的語音識別功能帶來巨大挑戰,過去包括 IBM 及微軟研發的中文語音辨識系統也都遠遠難說完美。目前 Apple 仍無法給出 Siri 服務支持亞洲語系(包括中文、日文與韓文)的時間表。

Apple Siri服務能否成為第四次人機互動革命?
▲對於顧客群遍及全球的 Apple 來說,仍未對非英語系國家開放(初期僅支持英語、法語和德語,其中英語支援三種口音:美式、英式和澳大利亞口音)的 Siri 也遠遠稱不上完美。

另一個 Siri 服務移植到非美國以外地區的瓶頸在於類似 Yahoo!等在地生活服務資料庫的缺乏。但日本的用戶發現即使 Siri 聽懂了他們的蹩腳英語,該系統也無法為他們提供與北美用戶相同的服務:因為能夠與 Siri 整合的日本市場網路服務仍然發常缺乏。在日本境內若要用 Siri 找餐館,Apple iPhone 4S 多半會回答「Sorry,I can’t look for restaurants in Japan」。由於搜索引擎並非 Apple 的優勢所在,所以 Siri 僅能透過其他業者的本地應用或者網路服務的 API 進行第三方資料庫的搜索任務,再整合所有結果中最合適的內容呈現給使用者。美國市場上多數服務性網站都開放了自己的 API 端口,如此一來 Siri 服務才可能有用武之地:要訂餐時直接透過第三方訂餐網站的 API ;要叫計程車時直接透過叫車網站的 API;要看電影時直接透過電影院訂票服務的 API。餐廳訂位在美國能夠使用便捷的 OpenTable 服務,不過在日本境內卻沒有這麼方便的選擇。由於短時間之內 Apple iPhone 4S 就要在全世界 100 個國家上市,Apple 不可能像在美國市場那樣特別為每個國家建立在地網路服務,預料必須等待一段時間之後、越來越多的在地服務網站提供了 Siri 相同的 API 資料交換機制之後才能有效解決。

Apple Siri服務能否成為第四次人機互動革命?
▲美國市場上多數服務性網站都開放了自己的 API 端口,如此一來 Siri 服務才可能有用武之地。

前景樂觀之餘亦有隱憂

隨著 Siri 服務得越來越成熟,預料未來問世的 iOS 裝置都將搭載這項服務。根據紐約時報的報導,熟悉 Apple TV 研發工作的消息人士透露下一代 Apple TV 將開始整合 Siri 服務,如此一來使用者就能拋棄按鈕繁多的遙控器,改用語音指令來控制想看的影音內容。沒有遙控器、沒有一堆不明意義的按鈕,這的確是「最簡單的使用介面」。

Apple Siri服務能否成為第四次人機互動革命?
▲熟悉 Apple TV 研發工作的消息人士透露下一代 Apple TV 將開始整合 Siri 服務,如此一來使用者就能拋棄按鈕繁多的遙控器,改用語音指令來控制想看的影音內容。

在螢幕命令列(鍵盤)、圖形介面(滑鼠),手勢(多點觸摸)以及現在的語音控制(人工智慧)這四波人機互動介面革命中,Apple 都沒有缺席。在圖形介面(滑鼠)革命中,Apple 輸給了後來居上的微軟,不過在手勢(多點觸摸)革命中 Apple 以大勝收場,在語音控制(人工智慧)革命中,Apple 與 Google 誰才是最後的贏家?不少資本市場上的分析師給予了肯定的回應。投資銀行摩根大通(JP Morgan)科技業分析師 Mark Moskowitz 在一份報告指出他對 Siri 服務的印象深刻並認為這有助於提升 Apple iPhone 4S 的市場競爭力:「一旦投資人深入研究 Siri 服務,就會發現它在一定程度上彌補了缺乏 Apple iPhone 5 未上市的遺憾」。投資銀行高盛(Goldman Sachs)分析師 Bill Shope 也抱持持相同意見,他認為 10 月 iPhone 發表會上最值得一提的就是 Siri 服務,也將成為 iOS 平台的重要轉捩點。投資銀行瑞銀(UBS)分析師 Maynard Um 則相信 Siri 服務是一個重大創新,未來將改變使用者與智慧型手機 / 平板電腦之間的互動方式。

Apple Siri服務能否成為第四次人機互動革命?
▲在圖形介面(滑鼠)革命中,Apple 輸給了後來居上的微軟,不過在手勢(多點觸摸)革命中 Apple 以大勝收場,在語音控制(人工智慧)革命中,Apple 與 Google 誰才是最後的贏家?不少資本市場上的分析師給予了肯定的回應。

隨著智慧型手機的硬體功能快速進步、加上智慧型手機內的感應器逐漸增加:例如通信所需的聲音、影像感測器、方便操作的重力感測器、以及 LBS(地理位置定位)服務所需的 GPS 定位感測器。假如我們抵達一個陌生的環境,過去對周圍環境的瞭解只能限制於自身的感官功能,現在卻能藉助智慧型手機內的各項裝置及 Siri 服務對周邊環境的感知與瞭解能夠更進一步提升。雖然 Siri 等應用給我們的生活帶來方便,卻也產生了一些新問題:由於人工智慧系統依賴網路信息來提供服務,未來任何實體商店若沒有認真完善其 SEO(Search Engine Optimization、搜索引擎優化)、就很難列入Siri 的名單之內。當我們在一個陌生的新環境中越來越依賴手機版本 Yelp 或大眾點評網的推薦訊息時,那種隨處逛逛、探索之後得到意外驚喜的樂趣(雖然此方式的效率可能非常低)也隨之消失。究竟何時依賴智慧型手機或 Siri 服務,何時用自己的本能和直覺來進行第一手的探索?這亦是一個值得深思的問題。

延伸閱讀:
Apple iPhone 4S 詳細規格介紹
iPhone 4S 電信三雄與蘋果同步開賣
iPhone 4S新機發表!外觀不變 功能更強
「手機支付」會是iPhone 5代新功能嗎?
iPhone 4S能否再次改變一切、再創輝煌?
sciroccopilota 於 12/19/2011 7:29:03 PM 修改文章內容
Sponsor

本文相關商品
門市空機價
已下市
  • 主螢幕尺寸
    3.5 吋
  • 主相機畫素
    500 萬畫素
  • 主螢幕材質
    TFT
  • 機身重量
    137 g(公克)
  • 機身顏色
    白, 黑
門市空機價
已下市
  • 主螢幕尺寸
    3.5 吋
  • 主相機畫素
    800 萬畫素
  • RAM記憶體
    512 MB
  • 電池容量
    1432 mAh(毫安培)
  • 主螢幕材質
    TFT
門市空機價
已下市
  • 主螢幕尺寸
    3.5 吋
  • 主相機畫素
    500 萬畫素
  • RAM記憶體
    512 MB
  • 機身重量
    137 g(公克)
  • 機身顏色
門市空機價
已下市
  • 主螢幕尺寸
    3.5 吋
  • 主相機畫素
    500 萬畫素
  • RAM記憶體
    512 MB
  • 主螢幕材質
    TFT
  • 機身重量
    137 g(公克)

留言

登入後即可留言

  • Mem671609

    星相隨 12/20/2011 at 6:55 PM

    那玩遊戲是不是也都用講的阿

  • Default sogi

    yvmp4 12/20/2011 at 7:15 AM

    引用『走到下站坐火車』所述:
    台灣人的中文發音根本不標準, 而且錯誤百出不僅捲舌音與不捲舌音搞不清楚ㄣ,ㄥ不分連字都是有邊唸邊, 沒有邊唸中間對於一是一, 二是二的電腦而言絕對是雞同鸭講, 笑話百出..........恕刪
    如果你的觀點是十年前提出來的,我會同意。
    不過現在可今非昔比了
    更何況這個技術還在發展之中

    雖然每個人發音不同
    只要第一次使用時
    跟著提示詞唸一遍
    馬上就可以上手了
    大家拭目以待

  • Default sogi

    Amo 12/20/2011 at 6:58 AM

    Siri如果支援中文
    那一定會有一堆有趣的事情發生
    呵呵

  • Default sogi

    走到下站坐火車 12/20/2011 at 6:52 AM

    就算siri開發出中文系統的語音輔助功能
    對身處台灣的一群人也是沒有用的

    因為台灣人的中文發音根本不標準, 而且錯誤百出
    不僅捲舌音與不捲舌音搞不清楚
    ㄣ,ㄥ不分
    連字都是有邊唸邊, 沒有邊唸中間
    對於一是一, 二是二的電腦而言
    絕對是雞同鸭講, 笑話百出

    當然出糗的也會包含我在內