近日,科技新聞界迎來(lái)了一則引人注目的報(bào)道。據(jù)悉,在即將于2025年舉行的I/O開(kāi)發(fā)者大會(huì)上,谷歌公司計(jì)劃展示一項(xiàng)名為Project Astra的創(chuàng)新項(xiàng)目,該項(xiàng)目旨在為安卓手機(jī)用戶(hù)帶來(lái)一款功能全面的AI助手。
這款A(yù)I助手不僅擁有強(qiáng)大的智能對(duì)話(huà)功能,更能深入理解用戶(hù)的實(shí)際情境,并據(jù)此主動(dòng)提出解決方案,甚至代替用戶(hù)執(zhí)行相關(guān)操作。這一創(chuàng)新技術(shù)將極大地提升用戶(hù)的日常體驗(yàn),使手機(jī)操作更加便捷高效。
在谷歌提供的演示案例中,當(dāng)用戶(hù)遇到自行車(chē)剎車(chē)問(wèn)題時(shí),Astra迅速展現(xiàn)出了其強(qiáng)大的能力。它不僅在線(xiàn)查找了用戶(hù)手冊(cè),并精確定位到相關(guān)頁(yè)面,還自動(dòng)打開(kāi)了YouTube應(yīng)用,為用戶(hù)播放了維修教程視頻。這一系列操作流暢而準(zhǔn)確,充分展示了Astra的智能化水平。
不僅如此,Astra還能通過(guò)郵件記錄查找零件信息,或直接撥打附近自行車(chē)店的電話(huà),以確認(rèn)所需零件的庫(kù)存情況。這種跨應(yīng)用的協(xié)同能力,使得Astra能夠?yàn)橛脩?hù)提供更加全面和貼心的服務(wù)。
Astra的核心技術(shù)在于其內(nèi)置的AI智能體,該智能體能夠模擬屏幕點(diǎn)擊和滑動(dòng)操作,從而控制Android應(yīng)用。在演示中,Astra成功打開(kāi)了PDF文件,并精確滾動(dòng)到指定頁(yè)面,同時(shí)在YouTube上搜索并播放了相關(guān)視頻。這一系列操作不僅展示了Astra的強(qiáng)大功能,也揭示了其背后的復(fù)雜技術(shù)和算法。
在演示視頻中,我們可以看到屏幕上顯示的圓形覆蓋層和邊緣發(fā)光效果,這是Astra通過(guò)讀取屏幕內(nèi)容來(lái)確定操作位置的表現(xiàn)。盡管視頻中的操作速度被加速了兩倍,但我們?nèi)匀豢梢愿惺艿紸stra的響應(yīng)速度。盡管還有一定的優(yōu)化空間,但這一技術(shù)已經(jīng)展現(xiàn)出了巨大的潛力和價(jià)值。
關(guān)于Astra的運(yùn)行方式,谷歌尚未透露更多細(xì)節(jié),但業(yè)界猜測(cè)它可能基于多模態(tài)Gemini Nano模型進(jìn)行開(kāi)發(fā)。這一猜測(cè)無(wú)疑為Astra的未來(lái)發(fā)展增添了更多期待和想象空間。