iPhone 4S Siri測試與Android語音輸入功能比較

2011/10/17
by genkiboy 特約編輯
87952
原本想一起寫在「iPhone 4S 排隊大作戰、開箱測試」本文裡面,不過做了太多測試,需要的篇幅比較大,寫在本文裡面板面太擁擠了,所以只好獨立出來寫一篇

iPhone 4S Siri測試與Android語音輸入功能比較



§Siri 測試§

網路連線問題

為了測試不同人的口音,尤其是台灣人的發音,所以我找了當時一起去買 iPhone 4 的朋友今天來幫我做口音測試,結果他的 iPhone 4S 一直遇到網路連線狀況,應該是太多人在玩 Siri,造成整個服務過載,不過也由此可知道,Siri 其實也是某種雲端服務,並不像傳統的語音辨識所有的資料都是儲存在本機中,Siri 應該有透過網路收集來各種的腔調,所以在將來整個語音辨識的辨識度應該會更高

就在我們想用另外一支 iPhone 4S 做測試的時候,結果 Siri 一直說出線連線問題,後來只好放棄用這支來測試,不過我自己的卻可以順利的使用,所以我們在猜有可能每個使用者的帳號會連到不同的伺服器,所以才會有這種同一時間下有人能用,有人不能用的狀況產生

對話練習篇...

既然 Apple 的廣告是想把 Siri 當做一個會對答的虛擬助理,那我們就用日常生活對話的方式來跟助理對話練習一番,這次測試一共有兩個人,基本上兩個人的問題都是類似的,這樣的測試主要是測試 Siri 有沒有辦法跟據不同的口音還有可能是錯誤的文法來猜對問題,畢竟在現實生活中,老外其實還是聽得懂我們的怪腔怪調跟有點怪異的中式文法,但是對於 Siri 是不是一種考驗?測了就知道!


閒聊鬼扯篇...

Apple 的廣告讓人非常驚艷 Siri 的表現,不過如果只測試廣告裡常用的功能,那就真的是不稀奇了,結束了日常對話測試,那就來個鬼扯閒聊吧,看看 Siri 是不是真的上知天文下之地理,也看看他是不是夠幽默。這個測試也是用兩個人來做,看看不同口音的人對於 Siri 的判對會不會有差異

閒聊測試 2

Siri 判斷機制篇...

從前面的測試看得出來Siri有比目前世面上的語音操控聰明許多,尤其是回答問題的時候相對比較人性,比較不像機器在回答問題,不會死板板的,所以會讓人感覺siri很像是人工智慧。遙想以前大學時代的畢業專題做過手機的智慧型地理旅遊資訊推薦系統,所以對於這類的人工智慧的判斷機制特別敏感,也因為這樣我們的測試中發現siri目前的判斷機制還是有點問題,siri對於文法上的錯誤正確與否其實不太知道,因為即便是在文法正確的情況下,siri還是會給一些很莫名其妙的答案,所以“應該”可以猜測目前siri利用的是關鍵字來trigger(啟動)功能,而不是用context awareness的機制來啟動,又或著是context awareness的機制還不夠完整,造成siri看不懂語意,所以才會出現文法結構正確,siri所抓得內容也全部正確,但是答案卻是怪怪的答案。

英文第一課“你說英文嗎?”


這段影片測試的目的是看看 Siri 啟動的機制,我們問了一連串,你說英文嗎,你說日文,你說西班牙文嗎,Siri 都會把“語言”當成“那個國家的菜”,所以會一直找吃得出來,Do / Can you speak+"語言"這是一句非常簡單的話,不過 Siri 既然會判斷成你想找那國的菜,所以從這裡可以猜得出來siri目前沒有建立這句話的判斷,對於 Siri 的判斷機制也可以略知一二

地理第一課

地理第一課第一節~這段影片測試的目的是測試 Siri 能不能正確的聽出地名,然後在地圖上秀出資訊,這測試就像小時後會問父母親,美國在哪裡,日本在哪裡,這種一萬個在哪裡,不過經過測試,Siri 只要是超過美國的地方就沒辦法提供地圖


地理第一課第二節~為了更嚴謹的驗證前一段的問題,這次我們從美國的城市開始往外擴大,一直到整個美國,Siri 都能正確的指出城市,每個州的州政府,以及美國首府,不過一旦出了美國就掛了,Siri 不但沒辦法提供路線,甚至連首都都沒辦法提供,這個部分滿奇怪的,同樣的判斷機制跟回答模式離開了美國就不行,甚至連第一輪開賣的國家日本,Siri 也沒辦法正確的指出東京。另外值得注意的一點,從第一個問題“Siri, where is San Francisco?",Siri 居然會找在舊金山裡面的"Siri",從這裡也可以看得出來 Siri 很難理解“語意”,這句話我想只要是會英文的人都會懂是要問舊金山在哪,而不是問舊金山裡的 Siri 在哪。所以從這裡又可以推測出來 Siri 的判斷機制,只要聽到"地名"+"名稱"Siri 就會去找這兩個組合,這也再次可以推測出siri是用關鍵字當做 Trigger 的條件,而不是利用語意來判斷。

iPhone 與 Android 語音輸入 PK...

Siri 這次在 iPhone 4S 還沒開賣的時候就已經很受到矚目了,連 Android 的聲控功能也被拿出來被討論一番,不過因為 Android 的聲控運作方式比較不像 Siri,所以在測試的時候我們就不把這部份考慮進去,畢竟兩種系統的比較基準點本來就不同,拿來比較沒有太大的意義。不過 iPhone 4S 跟 Android 同時都具有 Voice input,也就是聲控輸入的功能,剛好手上也有一隻 HTC Sensation,趁這機會來比較一下這兩個系統的語音辨識功能到底實不實用

測試一:情況假設是要傳簡訊,所以我們對著手機直接講要發送的內容,看看兩者是不是能正確的聽出來並且轉換成文字。裡面一共測試了五個句子,基本上,在測試中,兩支手機基本上都將所說的正確的轉換成文字,沒有什麼大問題,所以如果單純只是想發個簡訊之類的短句子,這兩個系統的語音輸入基本上都可以達到我們想要的目的,算是已經可以實用的功能
測試二:對於簡單的句子,兩種系統都能準確的轉換成文字,所以這段的測試是念一段國寄包裹的寄送須知,看看這種比較正式的書寫用語,兩種系統能不能都能正確的聽出並且轉換成文字。經過測試可以發現兩種系統都沒辦法正確的判讀,但是 iPhone 4S 的錯誤明顯比 Android 的少很多,Android 的基本上整個句子都不太對,所以這階段的測試 iPhone 略勝一籌

測試三:基本上跟測試二用的是一樣的句子,只是為了避免台灣人發音語調的問題,我們改用 Google 小姐來發音,從這測試可以看出來 iPhone 這次完全正確,而且判讀的速度也比 HTC Sensation 快很多,HTC Sensation 判讀出來的內容還是有很多的錯誤

測試四:這個測試我們用了 iPhone 4S 的廣告第一句話來當做測試的句子,原句為"iPhone 4 was groundbreaking, it's one of the best products we've ever designed, and it's gone on to become the #1 smartphone in the world",讓兩支手機同時聽,看看是否能判讀出廣告講的句子。測試結果發現基本上兩者都有點錯誤,但是 iPhone 的錯誤基本上還不影響閱讀,可是 HTC Sesation 判讀出來的句子基本上已經沒辦法閱讀,因為錯誤太多,造成句子非常的破碎


同步張貼於 http://genkiboy83.pixnet.net/blog/post/35801015

延伸閱讀:
Apple iPhone 4S 16GB 詳細規格介紹
iPhone 4S新機發表!外觀不變 功能更強
iPhone 4S能否再次改變一切、再創輝煌?
Steve Jobs上雲端後的Apple Store
iPhone 4S排隊大作戰、開箱測試
iPhone 4S/HTC Sensation拍照測試比較
 
genkiboy 於 10/23/2011 12:47:01 PM 修改文章內容
Sponsor
Mem84544
genkiboy 特約編輯
斜槓N年,特約編輯/工程師/鄉民/部落客/攝影師,似工程師也似藝術家,相信理性與感性可以和平共處。

本文相關商品
門市空機價
已下市
  • 主螢幕尺寸
    3.5 吋
  • 主相機畫素
    800 萬畫素
  • RAM記憶體
    512 MB
  • 電池容量
    1432 mAh(毫安培)
  • 主螢幕材質
    TFT
門市空機價
已下市
  • 主螢幕尺寸
    3.5 吋
  • 主相機畫素
    800 萬畫素
  • RAM記憶體
    512 MB
  • 電池容量
    1432 mAh(毫安培)
  • 主螢幕材質
    TFT
門市空機價
已下市
  • 主螢幕尺寸
    3.5 吋
  • 主相機畫素
    800 萬畫素
  • RAM記憶體
    512 MB
  • 電池容量
    1432 mAh(毫安培)
  • 主螢幕材質
    TFT

留言

登入後即可留言

  • Mem482139

    柚子 10/23/2011 at 3:52 AM

    引用『劉胖胖』所述:
    這技術真是利害耶~~~~!!什麼時候中文也能這樣玩呢~?..........恕刪
    官網說2012年會有中文,但沒說何時啊XDD

  • Default sogi

    Cry Baby 10/21/2011 at 4:42 AM

    真的很棒耶!
    好想要買一隻阿!
    越看越喜歡!

  • Medium 20140404155732 3nuds

    天下獨步 10/19/2011 at 7:39 PM

    我覺得APPLE應該要找LZ去設計中文版的SIRI,一定會很爆笑~

  • Default sogi

    紫色的天空 10/19/2011 at 10:19 AM

    感覺好好玩哦,我也想玩
    而且這樣又能練習英文,還真不錯吶

  • Default sogi

    流水 10/19/2011 at 9:50 AM

    原來不是人工智慧
    好無聊......
    只是搜尋率比較高的語音軟體了....

  • Medium     130

    小海 10/18/2011 at 10:41 PM

    siri真的很有趣
    不僅回答相當人性化,還非常的歡樂:DDD
    買一支不僅可以練習英語會話,還能每天都很開心
    敗了敗了 yayayayayayayaya

  • Default sogi

    阿中 10/18/2011 at 8:11 PM

    讚啦!!

  • Mem84544

    genkiboy 10/18/2011 at 4:03 AM

    引用『手雞王』所述:
    這個功能還不成熟,希望等到iPhone5出來時資料庫可以較完備但你已經可以從一細節上看到未來食衣住行只要對著電話講一講就可以搞定一切的雛形,行動密書不是開玩笑的(以後密書都快要沒工作了)一但整合聲紋辯識和其它加密輔助功能、再整合個人帳務系統、銀行往來資料、完整的商務應用和全球零時差的交通、金融、學術等各類資訊這套系統將徹底改變人類的生活、思考、工作模式老賈即使已經走了還是留下了這麼了不起的概念給我..........恕刪
    主要是語音回達的包裝得很漂亮

    不像過去的回答都死板板的,siri回答的會比較像人在講話

    光是這點感覺起來就差很多了

  • Default sogi

    手雞王 10/17/2011 at 11:21 PM

    這個功能還不成熟,希望等到iPhone5出來時資料庫可以較完備

    但你已經可以從一細節上看到未來食衣住行只要對著電話講一講

    就可以搞定一切的雛形,行動密書不是開玩笑的(以後密書都快要沒工作了)

    一但整合聲紋辯識和其它加密輔助功能、再整合個人帳務系統、銀行往來資料、

    完整的商務應用和全球零時差的交通、金融、學術等各類資訊

    這套系統將徹底改變人類的生活、思考、工作模式

    老賈即使已經走了還是留下了這麼了不起的概念給我們

    R.I.P Steve.

  • Default sogi

    嘎逼逼逼逼逼 10/17/2011 at 8:18 PM

    一開始看起來還兩光兩光..
    繼續看下去準確度還滿高的ㄋㄟ~

  • Medium mem312167

    劉胖胖 10/17/2011 at 8:17 PM

    這技術真是利害耶~~~~!!
    什麼時候中文也能這樣玩呢~?

  • Mem554918

    跳跳虎 10/17/2011 at 8:17 PM

    哈 可以叫它帶我去玩嗎?

  • Medium 012240040 724314991046683 3389831613185842075 n  1

    張里歐 Leo 10/17/2011 at 8:29 AM

    Siri感覺很有趣,我也想玩看看!