Google I/O 2024 開發者大會於今日(5/15)凌晨正式登場,在活動第一天的 Keynote 發表會上,Google 並未如預期發表 Android 15 作業系統,而是完全關注在 AI 相關技術最新發展,推出最新版 AI 模型 Gemini 1.5 Falsh / 1.5 Pro 與多項 AI 新功能,並表示持續將 AI 技術帶入 Android 系統與 Google 搜尋、相簿等功能當中,並預告正在以 AI 模型設計來電防詐功能。
其中,Gemini 1.5 Pro 模型即日起開放 150 個以上國家與地區的 Gemini Advanced 訂閱者使用,將脈絡長度擴展到從一百萬個詞元起算,因此能理解龐大文件內容,包括處理長達一千五百頁的文件檔案,或是處理約 100 封電子郵件的摘要,未來將擴展到處理長達一小時的影片內容,或者超過三萬行的程式碼。
Gemini 1.5 Pro 開放透過 Google 雲端硬碟或直接從裝置上傳檔案到 Gemini Advanced 進行處理;Gemini 1.5 Pro 還提升影像理解能力,透過拍照與分析,就能提供菜餚食譜,或是作業問題解答;也能詢問 AI 機器人在相簿內撈某個照片細節,AI 還會分析相簿與彙整照片資料。
另外,Gemini 1.5 Flash 模型,專為高頻率的任務設計,能簡化工作流程、簡化擁有 AI 技術輔助的應用程式。
Android 作業系統已經導入的 Gemini AI 助理,未來將開放在使用的應用程式喚出的附加功能,以及相關串流使用體驗,像是能在 YouTube 影片中點擊「詢問有關這部影片的問題」來進行提問,或是把生成圖片拖放到 Gmail、Google 訊息和其他地方。如果是 Gemini Advanced 訂閱者,還能在行動裝置上透過「詢問有關這個 PDF 的問題」選項,無須自己翻頁就能獲解答。
Google 同時預告今年稍晚,將從 Google Pixel 機種開始,讓 Gemini Nano 模型擁有全面多模態功能,從基本的文字處理,進階到還能理解影像、聲音和口說對話等更多內容,以及與上下文相關的資訊。
前述技術更新能體現在提升 TalkBack 輔助等功能上,以 TalkBack 功能來說,新 AI 技術就可彌補影像資訊不全的問題,幫助視障使用者獲得更豐富、更清晰的影像描述,且是直接在 Android 裝置上運作,沒有網路也能使用。
Google 並透露 Android 作業系統的 Gemini Nano 模型正在測試一項防詐騙新功能,當用戶在通話時,當 Gemini Nano 模型偵測到與詐騙有關的對話模式,像是不常見的銀行要求、要求緊急轉帳、使用禮品卡付款等敘述,或是要提供 PIN 碼或密碼等個人資訊,系統就會跳出警報。前述警報功能目前還在開發當中,預計今年稍晚會再公布更多資訊。
▲Android 作業系統未來有望透過 Gemini Nano 模型提供來電警示功能。
Google 也將開放 Gemini Advanced 服務訂閱者將所使用的 Gemini 模型進行個人化處理,將其稱為「Gem」,系統依照使用需求,只需要描述你希望 Gem 能完成什麼任務,以及想要的回應風格,就能將其打造成專屬健身夥伴、廚房助手,或是編寫程式碼夥伴。
同時,Google 也提出多項 AI 總覽新功能,像是 AI 摘要開放手動簡化語言或更詳細地分解內容等調整;可分析連續複雜問題、客製化備餐與旅程規劃的多步驟推理功能;對沒有單一解答的問題,Google 搜尋會利用生成式 AI 一起腦力激盪,搜尋結果頁面也會以 AI 技術整理分類。
另外,還新增一項名為「Ask with video」的影片辨識功能,用戶能錄製短片並詢問 AI 機器人,AI 功能就會辨識影片內容與使用者文體,並進行解答。上述功能將先於 Search Labs 上陸續開放使用,但初步只先開放美國地區使用者,以英文進行操作。
Workspace 版 Gmail 行動應用程式還支援郵件摘要、智慧回覆內容、Gmail 問答等 AI 功能,其中郵件摘要功能預計 5 月開始讓 Workspace Labs 用戶使用,6 月讓 Workspace 專用 Gemini 客戶以及 Google One AI 進階版方案的訂閱用戶者使用。智慧回覆內容、Gmail 問答則是 7 月開放 Workspace Labs 用戶,可在行動版和網路版的 Gmail 使用該服務。
Workspace 專用 Gemini 還新增名為「AI Teammate」功能,能創立一個 AI 同事,還能將 AI 同事加入其他對話中,透過撈取 Workspace 資訊來答覆所有問題。同時 Workspace 專用 Gemini 的更多功能將支援多國語言;其中,桌機版的 Gmail 和 Google 文件的「幫我撰寫」功能,未來幾週也將開放支援西班牙文和葡萄牙文。未來也將會持續增加更多支援語言。
另外,Imagen 3、、Music AI Sandbox、Veo 則分別是生成式圖片、生成式音樂與生成式影片的 AI 工具。
現在,你也可以同步追蹤我們的 Google 新聞、LINE TODAY 頻道,掌握《SOGI 手機王》最新發布的訊息。
▲只要訂閱《SOGI 手機王》就可以第一時間掌握最新的數位科技資訊、個人化專屬推播及優惠活動。
Gemini 發展現狀
針對生成式 AI 體驗上,Google 發表最新的 AI 模型 Gemini 1.5 Falsh / 1.5 Pro,兩個新模型突破 200 萬詞元脈絡窗口的技術限制,並已經在 200 多個國家與地區推出公開預覽版。Google 同時預告下一代 Gemma 2 模型,將進一步擁有 270 億個參數,效能可超越大兩倍的模型,還能在單一 TPUv5e 上運行。其中,Gemini 1.5 Pro 模型即日起開放 150 個以上國家與地區的 Gemini Advanced 訂閱者使用,將脈絡長度擴展到從一百萬個詞元起算,因此能理解龐大文件內容,包括處理長達一千五百頁的文件檔案,或是處理約 100 封電子郵件的摘要,未來將擴展到處理長達一小時的影片內容,或者超過三萬行的程式碼。
Gemini 1.5 Pro 開放透過 Google 雲端硬碟或直接從裝置上傳檔案到 Gemini Advanced 進行處理;Gemini 1.5 Pro 還提升影像理解能力,透過拍照與分析,就能提供菜餚食譜,或是作業問題解答;也能詢問 AI 機器人在相簿內撈某個照片細節,AI 還會分析相簿與彙整照片資料。
另外,Gemini 1.5 Flash 模型,專為高頻率的任務設計,能簡化工作流程、簡化擁有 AI 技術輔助的應用程式。
Android 系統內建 AI
雖然 Google 沒有發表 Android 15 作業系統,但在 2024 I/O 開發者大會展示了 Android 系統能使用的 Google AI 各項功能;繩提到已經在 Google 多款 Pixel 手機、三星多款裝置上啟用的「畫圈搜尋」功能,現有 1 億多台裝置正在使用中,未來將擴展到更多裝置上,希望讓使用人數在年底翻倍至 2 億以上。Android 作業系統已經導入的 Gemini AI 助理,未來將開放在使用的應用程式喚出的附加功能,以及相關串流使用體驗,像是能在 YouTube 影片中點擊「詢問有關這部影片的問題」來進行提問,或是把生成圖片拖放到 Gmail、Google 訊息和其他地方。如果是 Gemini Advanced 訂閱者,還能在行動裝置上透過「詢問有關這個 PDF 的問題」選項,無須自己翻頁就能獲解答。
Google 同時預告今年稍晚,將從 Google Pixel 機種開始,讓 Gemini Nano 模型擁有全面多模態功能,從基本的文字處理,進階到還能理解影像、聲音和口說對話等更多內容,以及與上下文相關的資訊。
前述技術更新能體現在提升 TalkBack 輔助等功能上,以 TalkBack 功能來說,新 AI 技術就可彌補影像資訊不全的問題,幫助視障使用者獲得更豐富、更清晰的影像描述,且是直接在 Android 裝置上運作,沒有網路也能使用。
Google 並透露 Android 作業系統的 Gemini Nano 模型正在測試一項防詐騙新功能,當用戶在通話時,當 Gemini Nano 模型偵測到與詐騙有關的對話模式,像是不常見的銀行要求、要求緊急轉帳、使用禮品卡付款等敘述,或是要提供 PIN 碼或密碼等個人資訊,系統就會跳出警報。前述警報功能目前還在開發當中,預計今年稍晚會再公布更多資訊。
▲Android 作業系統未來有望透過 Gemini Nano 模型提供來電警示功能。
AI 新功能
Gemini Live
Google 將 AI 模型 Gemini 導入 Google 訊息功能內,推出名為「Gemini Live」對話式 AI 體驗,讓用戶 Google 訊息上回復訊息時,同步跟 Gemini 進行語音聊天、互動;系統提供多樣化的自然人聲可供選擇,用戶能以自己習慣語速跟 Gemini 交談,也能跟日常對話一樣打斷 Gemini 回應,來詢問額外問題。「Gemini Live」將於未來幾中開放 Gemini Advanced 訂閱者使用。動態規劃體驗
Gemini Advanced 服務更新其旅行規劃設計功能,推出新的動態規劃體驗,不再像以往顯示一串建議活動清單,而是進一步量身訂做適合的行程。系統會同步從 Gmail 撈取航班資訊、結合 Google 地圖推薦飯店附近餐廳與景點,再結合飲食偏好、當地旅遊資訊、移動距離與時間等資訊,搭造出個人化旅遊行程推薦,並可隨時進行變更暨,系統會隨時更新行程。Gemini Advanced 新動態規劃體驗將於未來幾個月推出。個人化 Gemini
Google 也將開放 Gemini Advanced 服務訂閱者將所使用的 Gemini 模型進行個人化處理,將其稱為「Gem」,系統依照使用需求,只需要描述你希望 Gem 能完成什麼任務,以及想要的回應風格,就能將其打造成專屬健身夥伴、廚房助手,或是編寫程式碼夥伴。
與更多 Google 應用連結
Google 持續將 Gemini 與現有 Google 應用服務做串聯,像是 YouTube Music 擴充功能,就可藉由 Gemini 模型探索更多音樂;之後,Gemini 模型也將再導入 Google 日曆、Google Tasks 和 Google Keep 等應用程式與服務當中,像是拍下課表就能於日曆產生對應行事曆,或是拍下食譜就會在 Keep 內產生購物清單。上述新服務將即日起開放給企業客戶搶先使用。AI 總覽
Google 之前已嘗試把 Gemini 模型與搜尋服務進行結合,並於 Search Labs 中推出實驗型 AI 總覽功能;前述功能稍早推出正式版本,即日起開放美國使用者嘗鮮,後續將再擴展到更多國家與地區。同時,Google 也提出多項 AI 總覽新功能,像是 AI 摘要開放手動簡化語言或更詳細地分解內容等調整;可分析連續複雜問題、客製化備餐與旅程規劃的多步驟推理功能;對沒有單一解答的問題,Google 搜尋會利用生成式 AI 一起腦力激盪,搜尋結果頁面也會以 AI 技術整理分類。
另外,還新增一項名為「Ask with video」的影片辨識功能,用戶能錄製短片並詢問 AI 機器人,AI 功能就會辨識影片內容與使用者文體,並進行解答。上述功能將先於 Search Labs 上陸續開放使用,但初步只先開放美國地區使用者,以英文進行操作。
Workspace 相關應用
Workspace 企業應用程式與協作工具底下的 Gmail、Google 文件、雲端硬碟、Google 簡報和 Google 試算表中的側邊面板功能也開始使用 Gemini 1.5 Pro 模型,能夠回答更豐富多元的問題。Workspace Labs 和 Gemini for Workspace Alpha 使用者,即日起開始使用 Workspace 側邊面板中的 Gemini;而企業和個人使用者則從 6 月開始,能在電腦上透過 Workspace 專用 Gemini 外掛程式和 Google One AI 進階版方案使用這些功能。Workspace 版 Gmail 行動應用程式還支援郵件摘要、智慧回覆內容、Gmail 問答等 AI 功能,其中郵件摘要功能預計 5 月開始讓 Workspace Labs 用戶使用,6 月讓 Workspace 專用 Gemini 客戶以及 Google One AI 進階版方案的訂閱用戶者使用。智慧回覆內容、Gmail 問答則是 7 月開放 Workspace Labs 用戶,可在行動版和網路版的 Gmail 使用該服務。
Workspace 專用 Gemini 還新增名為「AI Teammate」功能,能創立一個 AI 同事,還能將 AI 同事加入其他對話中,透過撈取 Workspace 資訊來答覆所有問題。同時 Workspace 專用 Gemini 的更多功能將支援多國語言;其中,桌機版的 Gmail 和 Google 文件的「幫我撰寫」功能,未來幾週也將開放支援西班牙文和葡萄牙文。未來也將會持續增加更多支援語言。
更多 AI 功能
Google I/O 開發者大會同步推出包括 Project Astra、Imagen 3、Veo、Music AI Sandbox 等 AI 新功能。其中,Project Astra 能讓用戶拿起手機或是戴起智慧眼鏡,以裝置上鏡頭拍攝環境,並即時透過語音操作 AI 機器人來識別特定物體,系統甚至會記錄之前拍過哪些物體,而反過頭尋找。另外,Imagen 3、、Music AI Sandbox、Veo 則分別是生成式圖片、生成式音樂與生成式影片的 AI 工具。
訂閱手機王,快速掌握 Google 消息
想快速知道 Google 消息或相關優惠嗎?趕緊依照下圖指示,點選「允許」通知,之後有最新熱門機型的價格資訊時,你就不會錯過啦!(沒收到訂閱通知?點我看如何開啟)現在,你也可以同步追蹤我們的 Google 新聞、LINE TODAY 頻道,掌握《SOGI 手機王》最新發布的訊息。
Sponsor
曾任手機王編輯4年,也曾於時尚雜誌短暫嘗試數編/採編/責編的斜槓人生,手機常備4款修圖軟體+8款手遊
本文相關商品
相關新聞
2024/03/26
最新消息
2024/06/09
2024/06/09
熱門新聞
2024/06/03
2024/06/02
留言