Google即時語音轉錄文字 App加入過濾額外聲音干擾

2019/05/20
by mashdigi.com 專欄作家
2553

今年二月針對聽障人士打造的 Live Transcribe app,Google 稍早做了一些更新,讓 app 增加能夠辨識環境聲音功能,例如判斷聲音內容是周遭人士無謂的低語,或是鄰近的狗叫聲,避免造成不必要的誤判情況。

目前 Live Transcribe 已經可讓全球 18 億台 Android 裝置使用,本身透過連網以雲端協作形式進行機器學習,透過裝置端的麥克風進行收音,並且將收錄人聲口語內容轉換成文字呈現,讓聽覺障礙者可以透過文字敘述方式與人「對談」。



Google即時語音轉錄文字 App加入過濾額外聲音干擾



而為了改善麥克風可能同時錄到環境雜音,導致轉換成文字內容時會造成一些誤判困擾,因此 Google 藉由機器學習方式進一步判斷過濾人聲無謂的低語,或是環境中狗叫等聲音,讓聽障者能更容易透過聲音轉換文字方式明白他人陳述內容。

這樣的方式也有助於線上直播內容即時轉成文字敘述,同時也能讓接下來即將成為 Android Q 功能之一的 Live Caption 應用表現更加實用。



現階段 Live Transcribe app 已經可以對應英文(區分美式英文、英式英文、澳洲英文)、中文 (目前僅對應香港繁中、中國簡中用語)、日文,以及包含印度、中東、俄羅斯與歐洲等地區語言,並且增加文字內容選取複製功能,讓使用者更方便用於口語內容記錄,並且快速轉換成文字內容。

不過,就現階段的應用表現來看,Live Transcribe 依然有無法正確判斷連續對話,或是無法正確判斷過於口語化陳述內容的情況,但預期會在後續調整之下持續改善。

相關文章:
報導指稱Google可能基於政府命令終止與華為合作軟體服務
Google透過Translatotron模型實現更即時、正確,同時貼近原音的口語翻譯效果
Pixel 3a推出之後,Google默默關閉客製化保護殼Live Case銷售服務

Sponsor
Medium 14079934 1076779459066328 2251543420645598899 n
mashdigi.com 專欄作家
mashdigi建立於2013年11月下旬,主要以科技新聞、趣聞,以及科技相關技術看法、趨勢發展。

相關新聞

留言

登入後即可留言

  • Medium ad60670bbad6a64ab030 s 01

    古兔 5/21/2019 at 11:26 AM

    這樣就可以避免路上一堆無謂呢喃的人士了。