今年CES輝達(NVIDIA)發表NVIDIA Alpamayo 開源 AI 模型系列工具,涵蓋開放式 AI 模型、模擬工具與資料集,加速邁向下一世代安全、具推理能力的自動駕駛車輛(AV) 發展。
自動駕駛車輛必須能在極為多樣且複雜的駕駛情境中安全運作。其中罕見且高度複雜的場景被稱為「長尾情境(long tail)」——是自動駕駛系統最難以安全掌握的挑戰之一。傳統自動駕駛架構將感知與規劃分離,當面對新的或不尋常的情境時,往往限制了系統的可擴展性。近年端到端學習雖已取得顯著進展,但要真正克服這些長尾邊緣案例,仍需要能夠安全推理因果關係的模型,特別是在情境超出模型既有訓練經驗時。
Alpamayo 模型家族 首度將具備「思考鏈(chain-of-thought)」的推理式視覺-語言-行動(Vision Language Action, VLA)模型引入自動駕駛決策中,讓車輛擁有近似人類的思考能力。這些系統能逐步推理前所未見或極為罕見的情境,不僅提升駕駛能力,也強化決策可解釋性,是建立智慧車輛信任與安全、並實現規模化發展的關鍵。
NVIDIA 創辦人暨執行長 黃仁勳(Jensen Huang) 表示:「實體 AI 的 ChatGPT 時刻已經到來,即機器開始能在真實世界中理解、推理並採取行動,而無人計程車將是最早受惠的應用之一。Alpamayo將為自動駕駛帶來推理能力,使車輛能在罕見情境中進行思考、在複雜環境中安全行駛,並解釋其駕駛決策,這正是打造安全且可擴展自動化的基礎。」
具體而言,Alpamayo 將三大核心支柱「開放模型」、「模擬框架」與「資料集」整合為一個一致且開放的生態系,供任何汽車開發商或研究團隊建構其自動駕駛技術。Alpamayo 模型並非直接部署於車輛中運行,而是作為大規模教師模型(teacher models),讓開發者可進一步微調與蒸餾,整合為完整自動駕駛系統的核心模型。
廣泛的自動駕駛產業支持 Alpamayo
目前已經有多家領導企業與產業專家,包括 Lucid、JLR、Uber 與 Berkeley DeepDrive,皆對 Alpamayo 表達高度興趣,期望藉此打造可實現 Level 4 自動駕駛 的推理式自動駕駛系統。
Lucid Motors ADAS 與自動駕駛副總裁 Kai Stepper 表示:「向實體 AI 的轉變,凸顯出 AI 系統必須能推理真實世界行為,而不只是處理資料。先進的模擬環境、豐富的資料集與推理模型,正是演進過程中的關鍵要素。」
JLR 產品工程執行總監 Thomas Müller 指出:「開放且透明的 AI 開發,是負責任推動自動駕駛移動服務的關鍵。NVIDIA 將 Alpamayo 開源,有助於加速整個自動駕駛生態系的創新,讓開發者與研究人員能更安全地應對複雜的真實世界情境。」
Uber 全球自動駕駛與配送業務負責人 Sarfraz Maredia 表示:「處理長尾與不可預測的駕駛情境,是自動駕駛最具代表性的挑戰之一。Alpamayo 為產業帶來嶄新機會,加速實體 AI 發展、提升透明度,並推動安全的 Level 4 部署。」
S&P Global 資深首席分析師 Owen Chen 指出:「Alpamayo 1 能讓車輛理解複雜環境、預測新型態情境,並在過去未曾遇過的狀況下做出安全決策。其開源特性加速了產業整體創新,讓合作夥伴能依自身需求進行調整與深化。」
照片來源:NVIDIA