火山引擎发布大模型训练视频预处理方案 已应用于豆包
创始人
2024-10-15 16:32:57
0

10月15日消息,火山引擎在视频云技术大会上发布了大模型训练视频预处理方案。目前,该技术方案已应用于豆包视频生成模型。

火山引擎总裁谭待在活动致辞表示,在AIGC、多模态等技术的共同推动下,用户体验在多个维度上经历着深刻转变,“基于抖音业务实践和与行业客户共创,火山引擎视频云正积极探索AI大模型与视频技术的深度融合,在技术底座、处理链路和业务增长层面为企业寻找解法。”谭待说。

据介绍,对训练视频进行预处理是保障大模型训练效果的重要前提。预处理过程可以统一视频的数据格式、提高数据质量、实现数据标准化、减少数据量以及处理标注信息,从而使模型能更高效地学习视频中的特征和知识,提升训练效果和效率。

抖音集团视频架构负责人王悦表示,对大模型厂商而言,上述过程中面临着诸多挑战。

“首先,超大规模视频训练数据集导致计算和处理成本激增,”王悦说,“其次是视频样本数据参差不齐,然后是处理链路环节多、工程复杂,最后还面临着对GPU、CPU、ARM等多种异构算力资源的调度部署。”

借助Intel的CPU、GPU等不同资源,火山引擎此次发布的大模型训练视频预处理方案依托于自研的多媒体处理框架BMF,能有效应对模型训练的算力成本挑战。此外,该方案还在算法和工程方面进行了调优,可以对海量视频数据高质量预处理,短时间内实现处理链路的高效协同,提高模型训练效率。值得一提的是,火山引擎本次还发布并开源了移动端后处理解决方案BMF lite版本。BMF lite支持端侧大模型接入和算子加速,更加轻量、通用。

据了解,豆包视频生成模型PixelDance于9月24日发布,该模型采用 DiT 架构,通过高效的DiT融合计算单元和全新设计的扩散模型训练方法,突破了多主体运动的复杂交互、多镜头切换的内容一致性难题。目前,豆包视频生成模型已通过火山引擎面向企业开启邀测。

【来源:网易科技】

相关内容

热门资讯

北京城建集团董事长常永春被查,... 北京城建党委书记、董事长常永春。来源:北京城建集团官网 界面新闻记者 |白帆 近日,北京城建集...
原创 高... 声明:本文内容均引用权威资料结合个人观点进行撰写,文未已标注文献来源,请知悉。 最近,国际投行高盛...
大湾区酒价第15期|习酒窖藏1... 习酒窖藏1988多渠道价格跌至500以下,千元名酒价格小幅回升 今年“双11”,白酒价格波折不断。...
原创 玻... 作者:拉上窗帘 有朋友发来抖音视频,内容是福建曹德旺老板和他的私人飞机。 朋友问作者这是什么飞机? ...
2024年上半年经济总量出炉:... 今年7月份中旬,国家统计局发布了上半年经济情况,上半年GDP总量达到了616836亿元,同比增长5%...
疯狂小杨哥杭州办公总部出租,面... 据媒体报道,疯狂小杨哥杭州办公总部出租的消息引发关注。对此,三只羊集团方面回应称,公司即将搬迁,新地...
TK公会入驻最新行情分析,现在... 随着直播行业的迅猛发展,TikTok娱乐直播公会的入驻程序引起了众多内容创作者的热议。对于希望在这个...
陕西农信兴平联社召开2024年... 为全面总结上半年经营发展情况,深刻剖析问题,科学部署下半年重点工作,8月1日,兴平联社召开2024年...
2024上半年小红书营销:深耕... 近几年,短视频社交媒体平台已成为品牌营销的重要阵地。小红书,凭借其独特的UGC分享社区氛围、人群反漏...
「大算投」超越比特币?比肩以太... 在区块链技术浪潮的澎湃推动下,市场迎来了众多颠覆性创新项目,其中,Aleo以其独到的视野与尖端技术,...