最近英伟达在GTC 2026大会上搞出了个大动静,给大家看了AI和医疗机器人结合的新东西。他们搞了个叫Cosmos-H的模型,还有GR00T-H这个多模态架构。这两样东西都是为了帮医疗机器人理解医生的话,比如"缝合0.5厘米伤口",然后把这些话变成机器人能懂的动作命令。除了软件,他们还把一个叫Rheo的开发工具包给开放了出来,里面有很厉害的物理引擎,能把手术室里的各种设备布局和人体组织的感觉给模拟出来。 这次发布的内容特别丰富,包括数据集、模型还有开发蓝图。数据集是这次的重头戏,名字叫Open-H,里面收录了776小时的真实手术视频,涵盖了11种主流机器人系统和4类高发手术场景。这些视频通过结构化标注技术被标记好了,把器械的运动轨迹、组织的变化等关键参数都同步记录下来了。开发者拿了这些数据就能训练出更懂环境的决策系统,让机器人的自主操作精度更高。 为了方便大家上手,英伟达把这些资源都放到了GitHub和Hugging Face上面供大家下载。还有配套的Rheo工具包提供Python和C++两种接口。医院或者科研机构用这些东西就能快速开发出针对特定手术类型的定制化解决方案。这样一来就能大大缩短从算法设计到临床测试的周期。 这个物理AI平台其实就是想给手术机器人、康复设备这些细分领域搭个标准化的技术底座,帮它们把从实验室的试验品变成真正能用在医院里的设备。英伟达这次发布的成果确实让人眼前一亮,给智能医疗设备的发展提供了很大的助力。