五年前,浙江大學(xué)控制科學(xué)與工程學(xué)院的一間會(huì)議室里,剛從劍橋微軟研究院歸來的葉琦,向課題組成員描繪了一個(gè)令人振奮的長聘愿景:五年后,她希望讓機(jī)器人出現(xiàn)在答辯會(huì)現(xiàn)場,親自為在座的評委們端茶倒水。這一想法在當(dāng)時(shí)顯得頗具挑戰(zhàn)性,尤其是對這位非機(jī)器人科班出身的學(xué)者來說。
葉琦的學(xué)術(shù)旅程始于北京師范大學(xué)的本科學(xué)習(xí),她選擇了計(jì)算機(jī)視覺作為自己的研究方向。隨后,她進(jìn)入清華大學(xué)攻讀碩士學(xué)位,并在英國帝國理工學(xué)院完成了博士學(xué)位。在博士期間,她因手勢識別研究在學(xué)術(shù)會(huì)議上嶄露頭角,吸引了劍橋微軟研究院微混合現(xiàn)實(shí)與人工智能實(shí)驗(yàn)室負(fù)責(zé)人Jamie Shotton的注意。
Jamie Shotton的邀請讓葉琦有機(jī)會(huì)進(jìn)入微軟研究院交流,這次交流最終演變?yōu)橐粓觥罢匈t令”。面對學(xué)術(shù)大牛Jamie Shotton和計(jì)算機(jī)視覺經(jīng)典教材作者Christopher M. Bishop,葉琦最終決定加入微軟團(tuán)隊(duì),投身于當(dāng)時(shí)正升溫的MR/VR技術(shù)研究。2019年,微軟發(fā)布的第二代Hololens頭戴MR設(shè)備,正是葉琦團(tuán)隊(duì)的研究成果之一。
然而,一年多后,出于對自由探索前沿技術(shù)的熱愛,葉琦選擇回到浙江大學(xué)任職。浙大給予了她充分的學(xué)術(shù)自由,讓她能夠自主選擇研究方向。最終,葉琦決定轉(zhuǎn)向機(jī)器人領(lǐng)域,聚焦于靈巧手研究,盡管這意味著她需要從頭開始學(xué)習(xí)新知識。
葉琦的選擇并非沒有挑戰(zhàn)。機(jī)器人領(lǐng)域的研究在當(dāng)時(shí)相對冷清,尤其是靈巧手研究,更是鮮有人問津。但葉琦看到了機(jī)會(huì),她相信未來機(jī)器人與計(jì)算機(jī)視覺、計(jì)算機(jī)圖形學(xué)的融合將催生新的研究領(lǐng)域。這一預(yù)言如今正在成為現(xiàn)實(shí),隨著具身智能熱潮的興起,不同學(xué)科背景的研究者開始匯聚在這一新的交叉點(diǎn)上。
葉琦課題組的研究進(jìn)展迅速。2024年,他們發(fā)布并開源了大規(guī)模靈巧手抓取動(dòng)作數(shù)據(jù)集GraspM3,包含超過100萬條抓取軌跡和8000多個(gè)物體,為機(jī)器人抓取研究提供了豐富的數(shù)據(jù)資源。隨后,他們又推出了視觸預(yù)訓(xùn)練與靈巧操作的數(shù)據(jù)集與基準(zhǔn),進(jìn)一步推動(dòng)了靈巧手領(lǐng)域的發(fā)展。
葉琦的研究聚焦于靈巧操作的智能化技術(shù),她希望實(shí)現(xiàn)的目標(biāo)是:讓任何配備觸覺傳感器或其他傳感器的靈巧手都能自主完成各類操作任務(wù)。為了實(shí)現(xiàn)這一目標(biāo),她和團(tuán)隊(duì)正在努力降低靈巧手領(lǐng)域的進(jìn)入門檻,通過開源代碼和平臺,讓更多人能夠參與到這一領(lǐng)域的研究中來。
在談及研究經(jīng)歷時(shí),葉琦表示,她的興趣始于本科階段的圖像處理課程。她發(fā)現(xiàn)圖像處理能夠給予明確的反饋,這讓她對計(jì)算機(jī)視覺產(chǎn)生了濃厚的興趣。在清華讀研期間,她繼續(xù)深入研究圖像處理算法和算子。到了博士階段,她則開始從事手勢跟蹤研究,這一研究對手勢交互具有重要意義。
葉琦在微軟亞洲研究院的實(shí)習(xí)經(jīng)歷也讓她對圖像安全領(lǐng)域有了更深入的了解。她參與了研究網(wǎng)站利用扭曲字符圖片防止惡意訪問的項(xiàng)目,這一經(jīng)歷讓她對圖像識別技術(shù)的安全性和魯棒性有了更深刻的認(rèn)識。
在談及為何選擇從產(chǎn)業(yè)界轉(zhuǎn)向?qū)W術(shù)界時(shí),葉琦表示,她在微軟研究院工作期間發(fā)現(xiàn),做產(chǎn)品與開展前沿技術(shù)研究之間存在很大的差距。她更喜歡在高校從事研究工作,因?yàn)檫@里能夠給予她更多的學(xué)術(shù)自由和研究方向選擇權(quán)。
對于為何選擇靈巧手作為研究方向,葉琦表示,她看到了機(jī)器人與計(jì)算機(jī)視覺、計(jì)算機(jī)圖形學(xué)融合的趨勢。她相信未來靈巧手將成為這一融合領(lǐng)域的重要組成部分。盡管靈巧手研究在當(dāng)時(shí)面臨諸多挑戰(zhàn),但葉琦認(rèn)為正是這些挑戰(zhàn)讓她看到了機(jī)會(huì)。
葉琦課題組的研究進(jìn)展不僅體現(xiàn)在數(shù)據(jù)集的構(gòu)建上,還體現(xiàn)在算法的創(chuàng)新上。他們通過引入觸覺模態(tài)和自監(jiān)督學(xué)習(xí)方式,顯著提升了靈巧手對復(fù)雜操作任務(wù)的執(zhí)行效果。這一研究成果讓他們更加堅(jiān)定了從觸覺-動(dòng)作態(tài)關(guān)聯(lián)入手的研究方向。
葉琦表示,未來他們將繼續(xù)推進(jìn)靈巧手研究,降低進(jìn)入門檻,吸引更多人參與到這一領(lǐng)域中來。她相信在不久的將來,靈巧手將在各種應(yīng)用場景中發(fā)揮重要作用,為人類生活帶來更多便利。