这里是优化后的HTML结构文章: ```html spatiallm_article

杭州六小龙开源新模型SpatialLM,助力机器人瞬间理解 3D 世界!

SpatialLM:让机器人从视频中学习 3D 空间

最近,杭州的科技公司群核科技再次引起了行业关注,因其开源的空间理解模型 SpatialLM 被谷歌在一篇论文中点名感谢。这个模型的创新之处在于,它能让机器人通过一段普通的视频理解物理世界的几何关系,标志着机器人训练领域的一次重大突破。

如何工作?SpatialLM 的核心功能

SpatialLM 的核心功能是将手机拍摄的视频转化为三维空间布局信息。用户只需用手机录制家中的布局,SpatialLM 便能生成一个详细的 3D 场景,包括:

  • 房间的结构
  • 家具的位置
  • 通道的宽度

这一过程大大降低了机器人训练的成本,提高了训练的效率。

image.png

SpatialVerse:虚拟训练平台的完美结合

GTC2025 大会上,群核科技同时展示了他们的虚拟训练平台 SpatialVerse。这个平台结合了 SpatialLM 生成的数据,允许机器人在模拟环境中进行:

  • 避障
  • 抓取
  • 导航

从而形成从认知到行动的完整闭环。简而言之,机器人通过这个系统不仅能 “看” 到空间布局,还能理解如何在这些环境中进行操作

技术解析:MASt3R-SLAM 赋能空间理解

SpatialLM 的工作原理并不复杂。它利用 MASt3R-SLAM 技术将视频拆解为无数帧,提取出沙发、桌子等物体的细节并构建成点云模型。随后,模型将这些数据转化为结构化的 3D 布局,记录下每个物体的关键信息,如尺寸和位置。

与传统的训练方法相比,SpatialLM 不仅节省了时间和资源,还提升了机器人的空间认知能力

突破:机器人如何像人类一样理解环境?

这项技术的独特之处在于,它使机器人可以像人类一样理解和处理复杂的环境变化。无论是家庭生活中的日常物品,还是工作场所的工具,SpatialLM 都能帮助机器人快速适应并执行任务

这种能力对于提升机器人在真实环境中的表现至关重要,尤其是在当前的具身智能领域,许多技术依然面临落地难题。

开源推动未来,机器人训练迎来新纪元

群核科技通过开源 SpatialLM 和 SpatialVerse,正在重塑机器人训练的未来,使其能够在真实世界中灵活应对各种挑战。

项目地址

https://github.com/manycore-research/SpatialLM

杭州六小龙开源新模型SpatialLM,助力已优化并格式化 HTML 文章,提升了可读性和逻辑结构,并确保了正确的标签使用。如有进一步调整需求,请告诉我!                    
                    <!-- 作者信息 -->
                    <div class=

YiAI团队

YiAI团队

AI大模型技术专家团队

YiAI团队是一支专注于AI大模型应用的技术团队,由来自国内外知名科技公司的AI专家组成。 我们致力于为企业和开发者提供高质量、低成本的AI大模型API服务,涵盖文本生成、对话交互、 内容理解、知识问答等多个领域。团队拥有丰富的大规模语言模型开发和应用经验,深入理解 企业在AI落地过程中的实际需求和技术痛点。