Google舉辦I/O年度開發者大會,發表性能更強的AI模型Gemini1.5 Pro、輕量模型Gemini 1.5 Flash,整個發表會滿滿AI味。Google也為Gemini加入語音的對話功能,宣示AI助理的時代正式到來。
Google執行長皮查伊(Sundar Pichai)強調,「Google 所有工作都圍繞升成式AI模型Gemini來做,希望每個人都能從Gemini所做的事情中受惠」。其中,皮查伊提到的AI搜尋,正是將Gemini融入Google的多項服務之一,最大變化就是能透過具體的敘述搜尋,不用再點擊各種連結。
其他亮點包括:在Gemini相簿加入「Ask Photos」功能,用戶只要對Gemini下達想要尋找的特定情境照片,如:車牌號碼、小孩在游泳池畔等指令,Gemini就會協助從相簿中找出符合的照片。
未來想要找資料、照片不必再想關鍵字,直接「問 Gemini 就好」。圖片來源:Google
Google未來的AI助手「Astra」,可以透過視覺分析,讓AI進入手機、智慧眼鏡之中,透過鏡頭捕捉現實世界的畫面,即時解答用戶提出的難題。此外,Gemini也會進駐WorkSpace、Gmial等服務的側邊面板,開放用戶藉由問答,讓AI在文件、信件、雲端檔案查詢資料,或進行重點整理。
Gemini Advanced還新增可以自訂的「Gem」,功能類似ChatGPT提供的Custom GPT,能自由打造專屬的AI機器人,舉凡健身夥伴、廚房助手、編寫程式碼,都可透過設定期望Gem所完成的任務、回應風格,來建立特定的AI助手。Gemini另外加入影片製作功能「Veo」,輸入指令便可以生成長達1分鐘的高畫質AI影片,近期將會開放。
Veo是透過指令製作AI影片的新功能。圖片來源:Google
至於升級版的語言模型「Gemini 1.5 Pro」,可支援35種語言,擁有200萬個Token Window,用於測量上下文。Gemini 1.5 Pro有能力理解多個大型文件、快速處理一小時的影片內容,或是超過3萬行的程式碼庫。
兩小時的Google年度大會總共提到「AI」120次,主題全面圍繞在Gemini(前身為Brad)的最新應用,反而未提及新一代Android 15系統等資訊。