跳转至

把语言模型装进机器人

不是教你怎么训 VLA 的书。是 LLM 装进具身之后,每天要做的几十个具体判断的书。

这本书写给 2024-2026 这一波具身智能浪潮里卡在中间的人: - 知道 transformer 是怎么训的,看得懂 RT-2 那张图,但不知道下一步该往哪学; - 在公司里被分到机器人组,前一份工作还是 NLP / CV / 强化学习,老板让你三个月做出 demo; - 看每周 Twitter 上一堆 demo video,不知道哪些是真的,哪些差一个数量级。

读法:序言和第 1 章先读,把整本书的立场看清楚。后面四部分按顺序读最稳,但每一章都尽量自洽,挑你工作里正在卡的那一章先看也行。每章末尾有几个练习,大多数不是写代码,是让你回去重新看一遍自己的 demo video,问几个不一样的问题。


序言:这本书的定位

第 1 章 端到端与分层