Google推出Gemini 1.5 Pro,用更直覺的方式跟Gemini Live對話

在Google I/O 2024中Gemini推出許多更新,包括更長的脈絡長度(context window)、全新資料分析能力、整合更多Google應用程式,和更豐富的自訂選項。透過這些更新,你將可以跟目前為止最聰明也最能貼近個人需求的 Gemini 一起協作,讓它成為你的好幫手。

另外,有了生成式AI的幫助,Google搜尋將能夠幫助你做到更多的事情。無論是研究搜集資料或是動腦討論,Google搜尋都能幫你處理並為你提供解答。透過專門為Google搜尋量身打造的全新Gemini模型,將多步驟推理、規劃和多模態等特性,跟搜尋系統進一步整合。

使用全球最長的脈絡長度(context window)分析文件

Gemini 1.5 Pro將會開放Gemini Advanced的訂閱者使用,透過Gemini 1.5 Pro,使用者能體驗Google最新的技術進展,包括經過大幅擴展後從一百萬個詞元起算的脈絡長度(context window),是目前全球其他一般消費者使用的聊天機器人所擁有最高的脈絡長度。也正因如此,Gemini Advanced能理解內容更為龐大的文件,像是長達一千五百頁的文件檔案、或是處理約100封電子郵件的摘要。不久後,Gemini Advanced還可以處理長達一小時的影片內容,或者超過三萬行的程式碼。

為了讓所有使用者充分享受到較長脈絡長度的好處,新增了可以透過Google雲端硬碟或直接從裝置上傳檔案到Gemini Advanced的功能。現在你可以運用這項功能,快速取得複雜文件中的疑問解答和深入分析結果,比如租賃合約中關於寵物條款的細節,或是比較兩篇冗長研究論文的關鍵論述。未來,Gemini Advanced能夠擔任你的資料分析師,深入解讀試算表等上傳資料檔案,並產出客製的圖表視覺。Gemini 也會確保你上傳的檔案以及相關對話保持隱私,不會被用於訓練其模型。

Gemini支援原生多模態模型,而且1.5 Pro版大大提升了影像的理解能力。舉例來說,你在最愛的餐廳吃到喜歡的菜,只要拍張照,就可以請Gemini提供食譜。或是如果你一直沒有辦法解開一個數學題目,也只要拍張照,讓Gemini透過步驟來幫助你尋找答案。Gemini 1.5 Pro將會像超過150個國家/地區中的Gemini Advanced訂閱者推出,並支援超過35種語言。

用更自然的方式跟 Gemini Live 對話

Google也推出了與Gemini互動的新方式,不管是打字或語音,都能更自然地取得Gemini的協助。 你可以在Google 訊息中使用Gemini,讓你不用離開和朋友互傳訊息的應用程式,就能和Gemini輕鬆聊天。

在接下來的幾個禮拜內,Google將為訂閱Gemini Advanced的使用者推出Gemini Live。透過Gemini Live,你可以從眾多自然流暢的人聲語音中,選擇自己最喜歡的選項作為Gemini回應時所使用的語音。不只如此,你在跟Gemini互動時可以用自己習慣的語速交談,也能中途打斷 Gemini 的回應來詢問額外的問題進一步釐清資訊,就像任何日常對話一樣。

舉例來說,假設你要準備一個工作面試跟練習一個重要的演講,可以透過Gemini Live來幫你準備。Gemini可以提供你在面試過程中可以分享跟強調的工作技能,或是在上台演講前有一些幫助放鬆的小技巧。今年下半年,你也可以透過手機鏡頭來使用Gemini Live, 讓你跟Gemini 暢聊眼前所見的事物。

輕鬆制定複雜與繁瑣的計畫 

有時候,為了好好享受一場旅行,你可能會花上不成比例的時間在研究旅遊推薦景點和規劃完美個行程。透過Gemini Advanced新的規劃體驗,可以讓你節省時間,不只是顯示一串建議活動清單,更可以為你量身訂做適合的行程。

想像一下,你可以問Gemini:「我想帶家人去邁阿密過勞動節假期。我的兒子非常喜歡藝術類的內容、我的老公很想要吃到新鮮的海鮮。你可以從 Gmail 裡面找到我的航班跟旅館資訊,幫我規劃那週末的行程嗎?」

這個問題要求Gemini不僅止於像其他聊天機器人一樣,呈現在網路上的公開資訊。Gemini會考量您的航班時間、飲食偏好以及當地博物館的資訊,同時也了解每個地點的位置以及在各活動之間移動所需的時間。它會從你的Gmail撈出航班資訊、利用Google地圖推薦飯店附近的餐廳和博物館,並使用搜尋功能推薦其他活動,像是設計區徒步旅行或海灘時光,來填滿您一天的剩餘時間。Gemini會幫你綜合所有資訊,並建立一份符合要求的客製化行程。之後如果你有任何計畫變更或需要增加詳細資訊,Gemini 還會自動更新行程計畫。

這個嶄新的動態規劃體驗將在接下來幾個月內於Gemini Advanced推出。

打造個人化 Gemini:Gem 

為了提供更加個人化的體驗,Gemini Advanced訂閱者很快就能建立自訂版的Gemini,稱為Gem。你可以根據需求打造各式各樣符合夢想的Gem,包括個人專屬的健身夥伴、廚房助手、編寫程式碼的好夥伴,甚至是創意寫作的導師等等。Gem建立的方式非常簡單,只需要描述你希望Gem能完成什麼任務,以及你想要的回應風格,像是:「你是我的路跑教練,用要正向、樂觀和激勵的方式來幫我排定每天的慢跑訓練計畫。」告訴Gemini這些指示後,你只需要透過一個點擊,它就能延伸這些指令,建立符合你的特定需求的Gem。

與更多Google應用程式連結 

去年,我們在Gemini裡面推出的擴充功能,讓你能用使用熟悉的Google應用程式和服務,幫助你處理更多的任務。Google會持續整合更多Google應用程式到Gemini,像是最新推出的YouTube Music擴充功能,讓使用者能播放、搜尋並探索更多新音樂,找到自己喜歡的歌曲還有歌手。不久,將整合更多Google工具到Gemini裡面,包括Google 曆、Google Tasks和Google Keep。

利用 AI 總覽快速取得回答

有時候你只想快速找到答案,但沒有時間看網路上的大量資訊。這個時候,Google的AI總覽就能派上用場。目前使用者已經透過Search Labs 所推出的實驗功能來使用AI總覽,次數已經高達數十億次。使用者非常喜歡能夠同時獲得概要資訊,並且同時可以透過連結了解更多內容。

從今天開始,Google將率先在美國推出AI總覽,並於日後支援更多國家。從這周起,將會有數億的使用者可以進一步體驗AI總覽,我們也預計在年底前讓超過十億的使用者能夠使用這項新功能。

透過 AI 總覽,針對複雜的問題,使用者會造訪並瀏覽更多元的網站來尋求解答,在AI總覽出現的連結比傳統網頁列表中出現的連結獲得更多點擊。隨著Google擴展這項體驗,會持續把有價值的流量導向具有高度品質的出版商與創作者。而廣告也會像之前一樣,顯示在頁面上的專用版位,並且加上清楚標示,讓使用者知道哪些是自然搜尋結果,哪些是贊助廣告。

調整你的 AI 總覽

不久後,你也可以選擇簡化語言或更詳細地分解內容來調整AI摘要。如果你對於這個主題不是很熟悉或想要簡化回答內容來滿足你孩子的好奇心,這功能會特別有用。這項更新將率先在Search Labs推出,支援美國地區的英文查詢。

回答更複雜的問題

透過客製化Gemini模型的多步驟推理能力,AI總覽能處理複雜的問題。不管你的問題有多少細節和該注意的地方,都不必分次查詢,都可以一次用完。

舉例來說,你想找一間新的瑜珈或皮拉提斯教室,而且希望它的評價不錯、通勤方便,而且有提供新會員優惠。不久後,你就可以直接查詢:「幫我找在波士頓最棒的瑜珈或皮拉提斯教室,並告訴我它們的新會員優惠資訊、還有從燈塔山走過去的時間。」

AI總覽很快就會在Search Labs推出並支援多步驟推理功能,並先適用於美國地區的英文查詢。

提前制定計畫

除了替複雜問題找出正確的答案或資訊之外,Search還能幫助你制定計畫。透過Search裡面的規劃能力,它可以幫助你依照需求制定對應的計畫,像是度假規劃或是準備三餐等。舉例來說,你可以搜尋:「幫我制定三天的備餐菜單,要容易準備,而且能餵飽一大群人。」接下來,你就可以大概有個概念,不必在龐大繁雜的資訊中,慢慢搜找各式食譜。

如果想改菜單,也可以直接調整你的需求,像是把晚餐換成素食料理。Google搜尋會替你客製備餐內容,並且讓你能夠把食材清單快速匯出到Google文件或Gmail,方便採買規劃。 客製化備餐與旅程規劃功能今年會在Search Labs推出,並先支援美國地區的英文查詢。今年下半年,新增更多客製功能和計畫類別,像是規劃派對、跟運動健身等類型。

探索 AI 整理的搜尋結果頁面

問題沒有單一的正確解答時,常需要花很多時間考慮各種選項,才能找到靈感。不久後,如果你需要發想創意,Google搜尋會利用生成式AI和你一起腦力激盪,搜尋結果頁面也會以AI技術整理分類,方便你查看瀏覽。這些實用的搜尋結果會歸類在獨特的AI生成標題下,並呈現多種觀點和內容類型。

在美國地區進行英文搜尋時,你將會很快就會看到這個全新的AI整理搜尋結果頁面,從餐飲和食譜開始,接著是電影、音樂、書籍、飯店、購物等等。

運用AI在影片中搜尋也沒問題

Google搜尋不只是在文字框裡打出文字搜尋而已,使用者想要尋找的或許是你周遭的東西,也可能是移動中的物體。透過對於影片理解技術的進步,可以將視覺搜尋提升到全新的層次,讓你可以用影片內容提出問題。

假設你在二手店買了黑膠唱片機,但回家打開後卻不能用,金屬唱針也不規則晃動。這個時候,你可以拍下影片直接搜尋。不必思考該如何描述問題,AI總覽就能為你提供解決問題的方法和步驟。

這項功能不久後就會在Search Labs中推出,適用於美國境內的英文查詢,我們預期會逐步擴大支援地區。現在你看到的這些Google搜尋新功能,都還只是Gemini時代革新的一小部分。未來會繼續將Gemini的主動代理功能,整合到大家熟悉的Google搜尋中,不久後,就能在搜尋、資料簡化、研究、計畫制定及腦力激盪等各方面,成為使用者最實用的好夥伴。不久,Google可以幫助你搜尋、簡化內容、進行研究、協助規劃、腦力激盪等。

史塔夫短評:Gemini更聰明、更客製化

歐帝斯

現職Stuff Taiwan副總編輯,曾任職於Sogi與Mobile01,2003年開始擔任手機評測,喜歡玩新奇的3C產品,近年熱衷於自助旅行,喜歡在旅行時享受邊玩邊測試產品的樂趣。工作邀約:otis0329@gmail.com,個人粉專:https://www.facebook.com/otis1983