对标谷歌Meta,字节跳动入局”世界模型”竞赛
创始人
2025-08-21 02:11:25
0

据The Information披露。国内科技巨头字节跳动,目前正加速布局通用人工智能赛道,其核心人工智能部门Seed正在秘密研发对标Genie3、Meta V-JEPA 2的"世界模型"。

目前,字节跳动的世界模型项目已进入攻坚阶段,该项目由前通义千问核心成员周畅带队,依托抖音/TikTok的海量视频数据与自研E-4D框架,剑指虚拟世界模拟与机器人训练等前沿领域。

The Information表示,此次技术布局标志着字节跳动正式加入全球AI巨头争夺战。

何为“世界模型”,简单来说就是模拟真实环境的规律和人类互动方式,未来可用于训练机器人、自动驾驶系统或构建虚拟世界,被视为通向通用人工智能(AGI)的重要路径之一,其核心目标是通过构建可模拟真实物理规律的数字孪生环境。

据介绍,新模型将深度融合抖音日均超10亿次视频流数据,涵盖人物行为、物体运动、场景交互等多维度动态信息,为训练提供媲美真实世界的素材库。值得关注的是,近期开源的EX-4D技术将发挥关键作用,这项可将单目视频转化为4D多视角场景的创新框架,突破了传统单帧图像处理的局限性,为实现时空连续性的环境建模奠定基础。

在全球AI竞赛进入新阶段的背景下,字节跳动在AI领域的布局还是相对来说比较“低调”。

就以“世界模型”为例,谷歌Genie3凭借其"分钟级场景连贯性"和"文本驱动事件修改"功能已抢占先机,其720P分辨率、24帧每秒的生成能力,以及支持物理引擎自主学习的特性,已在游戏开发和机器人训练领域引发变革。

同样是“"世界模型”的标杆产品,Meta V-JEPA 2则以独特的联合嵌入预测架构实现物理推理能力突破,通过100万小时视频训练构建的预测模型,使机器人动作规划效率提升至同类产品的30倍。

面对巨头们的强势表现,字节跳动的新模型需在保持短视频数据处理优势的同时,突破物理仿真与长时程一致性等技术瓶颈。

从战略层面看,字节跳动的世界模型布局与其核心业务形成深度协同。

目前,抖音/TikTok积累的超20亿用户行为数据,为模型构建了独特的人物交互训练集;如果能结合旗下PICO 设备以及其他智能家居生态,那么未来或可构建虚实融合的交互场景,复制其在移动互联网时代的终端优势。

相关内容

热门资讯

北京城建集团董事长常永春被查,... 北京城建党委书记、董事长常永春。来源:北京城建集团官网 界面新闻记者 |白帆 近日,北京城建集...
原创 高... 声明:本文内容均引用权威资料结合个人观点进行撰写,文未已标注文献来源,请知悉。 最近,国际投行高盛...
大湾区酒价第15期|习酒窖藏1... 习酒窖藏1988多渠道价格跌至500以下,千元名酒价格小幅回升 今年“双11”,白酒价格波折不断。...
原创 玻... 作者:拉上窗帘 有朋友发来抖音视频,内容是福建曹德旺老板和他的私人飞机。 朋友问作者这是什么飞机? ...
2024年上半年经济总量出炉:... 今年7月份中旬,国家统计局发布了上半年经济情况,上半年GDP总量达到了616836亿元,同比增长5%...
疯狂小杨哥杭州办公总部出租,面... 据媒体报道,疯狂小杨哥杭州办公总部出租的消息引发关注。对此,三只羊集团方面回应称,公司即将搬迁,新地...
TK公会入驻最新行情分析,现在... 随着直播行业的迅猛发展,TikTok娱乐直播公会的入驻程序引起了众多内容创作者的热议。对于希望在这个...
陕西农信兴平联社召开2024年... 为全面总结上半年经营发展情况,深刻剖析问题,科学部署下半年重点工作,8月1日,兴平联社召开2024年...
2024上半年小红书营销:深耕... 近几年,短视频社交媒体平台已成为品牌营销的重要阵地。小红书,凭借其独特的UGC分享社区氛围、人群反漏...
「大算投」超越比特币?比肩以太... 在区块链技术浪潮的澎湃推动下,市场迎来了众多颠覆性创新项目,其中,Aleo以其独到的视野与尖端技术,...