【千里馬計(jì)劃】VLA 算法研究員
20000元以上
職位投遞郵箱:[email protected]
職位投遞網(wǎng)址鏈接:https://app.mokahr.com/su/gmymez
工作地域:北京市 / 上海市
職位類別: -
學(xué)歷要求:碩士研究生 / 博士研究生
招聘人數(shù):18人
發(fā)布時(shí)間:2025-08-18瀏覽量:469
* 職位描述:
| 職位描述: 1. 深度參與大模型VLA強(qiáng)化微調(diào)工作,包括:監(jiān)督微調(diào)、離線強(qiáng)化預(yù)訓(xùn)練、真機(jī)強(qiáng)化學(xué)習(xí); 2. 設(shè)計(jì)優(yōu)化VLA強(qiáng)化微調(diào)算法,突破模仿學(xué)習(xí)上限,減少人工數(shù)據(jù)依賴。 崗位職責(zé): 1. 模型研發(fā)與優(yōu)化: (1)負(fù)責(zé)視覺語言行動(dòng)模型(VLA)的端到端研發(fā),包括架構(gòu)設(shè)計(jì)、數(shù)據(jù)處理、訓(xùn)練優(yōu)化及真機(jī)部署二、探索多模態(tài)輸入(視覺、語言、動(dòng)作)到機(jī)器人動(dòng)作輸出的映射邏輯,優(yōu)化模型效率和精度; (2)實(shí)現(xiàn)主流框架如 OpenVLA、RDT-1B、PIO等的改進(jìn)與適配。 2. 技術(shù)研究與創(chuàng)新: (1)跟蹤VLA領(lǐng)域前沿技術(shù)(如流匹配、動(dòng)作分塊架構(gòu)),探索新算法在具身智能中的應(yīng)用; (2)研究強(qiáng)化學(xué)習(xí) (DQN/PPO/SAC)、模仿學(xué)習(xí)(BC/IRL) 與VLA的融合方法。 |







重慶千里智駕科技有限公司
招聘信息

津公網(wǎng)安備12010402000967號(hào)