文心大模型X1代码、数学、推理能力超越最新版DeepSeek V3!即将上线千帆大模型平台
创始人
2025-03-27 04:47:09
0

今日,据媒体报道,在多个公开数据集测评中,百度最新发布的文心大模型X1,在数学、代码、推理等能力上表现优异,超越升级后的DeepSeek-V3-0324。

在数学场景中,GSM8K数据集测试后结果显示,文心X1得分95.6,DeepSeek-V3-0324得分93.6;代码生成层面,HumanEval数据集测试后结果显示,文心X1得分90.9,DeepSeek-V3-0324得分86.6;在知识推理层面,C-Eval数据集测试后结果显示,文心大模型X1得分88.6,DeepSeek-V3-0324得分85.1。

近日,DeepSeek官方宣布V3模型完成小版本升级的消息,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。

而在不久前,百度正式发布文心大模型X1,具备更强的理解、规划、反思、进化能力。文心X1由百度的慢思考技术发展而来。作为能力更全面的深度思考模型,兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

据悉,文心大模型X1即将上线千帆大模型平台,API调用价格为DeepSeek-R1调用价格的50%。

校对 潘政

相关内容

热门资讯

北京城建集团董事长常永春被查,... 北京城建党委书记、董事长常永春。来源:北京城建集团官网 界面新闻记者 |白帆 近日,北京城建集...
大湾区酒价第15期|习酒窖藏1... 习酒窖藏1988多渠道价格跌至500以下,千元名酒价格小幅回升 今年“双11”,白酒价格波折不断。...
原创 玻... 作者:拉上窗帘 有朋友发来抖音视频,内容是福建曹德旺老板和他的私人飞机。 朋友问作者这是什么飞机? ...
2024年上半年经济总量出炉:... 今年7月份中旬,国家统计局发布了上半年经济情况,上半年GDP总量达到了616836亿元,同比增长5%...
疯狂小杨哥杭州办公总部出租,面... 据媒体报道,疯狂小杨哥杭州办公总部出租的消息引发关注。对此,三只羊集团方面回应称,公司即将搬迁,新地...
陕西农信兴平联社召开2024年... 为全面总结上半年经营发展情况,深刻剖析问题,科学部署下半年重点工作,8月1日,兴平联社召开2024年...
TK公会入驻最新行情分析,现在... 随着直播行业的迅猛发展,TikTok娱乐直播公会的入驻程序引起了众多内容创作者的热议。对于希望在这个...
2024上半年小红书营销:深耕... 近几年,短视频社交媒体平台已成为品牌营销的重要阵地。小红书,凭借其独特的UGC分享社区氛围、人群反漏...
「大算投」超越比特币?比肩以太... 在区块链技术浪潮的澎湃推动下,市场迎来了众多颠覆性创新项目,其中,Aleo以其独到的视野与尖端技术,...
彩票兑奖个税操作口径,明确了! 注意了! 买彩票兑奖个税操作口径有变化了! 8月16日,财政部、国家税务总局、民政部、国家体育总局联...