
CoreWeave (CRWV) 近日宣布推出無伺服器強化學習(Serverless RL)功能,這是一種能快速訓練AI代理的技術。週三,該公司股價應聲上漲約9%。這項創新技術是首個公開提供的全自動強化學習功能,能無縫擴展至數十個圖形處理單元(GPU),只需Weights & Biases帳戶和API密鑰即可開始使用,為開發者提供更快速的反饋迴路,並降低進入門檻。
強化學習專注自主決策
強化學習(RL)是一種專注於自主代理決策的機器學習過程。自主代理是一種能夠獨立於人類直接指令而根據環境做出決策和行動的系統。
結合OpenPipe擴展AI能力
這項新功能是在CoreWeave收購OpenPipe後數週內推出的,將其強化學習工具與Weights & Biases的AI開發平台結合,並由CoreWeave的AI雲端提供支持。
企業AI價值解鎖的關鍵
CoreWeave的共同創辦人暨首席技術官彼得·薩蘭基表示:「我們正在整合基礎設施、強化學習框架和開發者工具,以協助各種規模的企業解鎖AI代理的價值,這讓CoreWeave與眾不同。」
發表
我的網誌