# 字节跳动推出机器人用的人工智能“大脑”拥有 TikTok 的公司字节跳动推出了一种系统,充当机器人的“大脑”。它可以执行家务任务,如晾衣服或清理桌子。GR-3是一种大规模的“视觉-语言-行动”语言模型,使得机器人能够理解自然语言指令,并执行与未知物体相关的通用任务。它们可以在新的环境中工作,或处理与尺寸和空间关系相关的抽象概念。在网站发布的视频中,展示了实验室的双臂机器人ByteMini如何将衣架插入衬衫并将其放置在架子上。> 🚀🚀🚀 想知道机器人处理现实世界家庭任务需要什么吗?长时间执行、可变形物体灵巧性和未见物体泛化——来见见 GR-3,字节跳动种子团队的新视觉-语言-行动(VLA)模型!> > GR-3 是一种可推广的...pic.twitter.com/zECRjaXC0J> > — Xiao 马 (@yusufma555) 2025 年 7 月 22 日在单独的技术报告中,团队表示,机器人能够处理短袖衣物,尽管“所有训练数据中的物品都是长袖的。”通过GR-3,机器人能够从多个选项中选择特定物品并将其放置在指定位置。系统不仅能够根据名称识别对象,例如“大小盘子”,也可以根据空间特征,例如“左边”。它可以通过一个指令完全执行“清理餐桌”的任务。为了训练模型,字节跳动采用了多组件的方法,包括:* 在“大数据集”格式的“图像-文本”上进行联合学习;* 在通过VR设备收集的人类行为轨迹信息上进行再训练;* 模仿方法基于安卓设备的运动数据进行设置。> > «我们希望 GR-3 能够成为创建能够帮助人们日常生活的通用机器人的一步」,团队在声明中表示。> > > 提醒一下,在一月份,初创公司 Perplexity AI 宣布计划收购美国 TikTok。该公司向 ByteDance 提出了将 Perplexity、TikTok U.S. 和新的资本合作伙伴合并为一个法律结构的提议。
字节跳动推出了用于机器人的人工智能“脑”
字节跳动推出机器人用的人工智能“大脑”
拥有 TikTok 的公司字节跳动推出了一种系统,充当机器人的“大脑”。它可以执行家务任务,如晾衣服或清理桌子。
GR-3是一种大规模的“视觉-语言-行动”语言模型,使得机器人能够理解自然语言指令,并执行与未知物体相关的通用任务。它们可以在新的环境中工作,或处理与尺寸和空间关系相关的抽象概念。
在网站发布的视频中,展示了实验室的双臂机器人ByteMini如何将衣架插入衬衫并将其放置在架子上。
在单独的技术报告中,团队表示,机器人能够处理短袖衣物,尽管“所有训练数据中的物品都是长袖的。”
通过GR-3,机器人能够从多个选项中选择特定物品并将其放置在指定位置。
系统不仅能够根据名称识别对象,例如“大小盘子”,也可以根据空间特征,例如“左边”。它可以通过一个指令完全执行“清理餐桌”的任务。
为了训练模型,字节跳动采用了多组件的方法,包括:
提醒一下,在一月份,初创公司 Perplexity AI 宣布计划收购美国 TikTok。该公司向 ByteDance 提出了将 Perplexity、TikTok U.S. 和新的资本合作伙伴合并为一个法律结构的提议。