发布豆包深度思考模型,火山引擎要争夺Agent市场

界面新闻记者 | 肖芳
界面新闻编辑 | 文姝琪

DeepSeek走红数月之后,字节跳动终于对外发布自研的深度思考模型。

4月17日,豆包1.5・深度思考模型由火山引擎对外发布,面向企业市场提供服务。技术报告显示,豆包深度思考模型采用MoE架构,总参数为200B,激活参数为20B。相比之下,同样采用MoE架构的DeepSeek-V3模型总参数为671B,激活参数为37B。

豆包1.5・深度思考模型的参数实现更小,但从评测结果来看,其能力不逊于顶尖模型的效果。其中,豆包1.5・深度思考模型在专业领域的推理任务中表现出色,数学推理AIME 2024测试得分追平OpenAI o3-mini-high,编程竞赛和科学推理测试成绩也接近o1,在编程竞赛Codeforces pass@8得分接近 OpenAI o1,在科学推理GPQA 得分接近o3-mini。

同时,基于高效算法和高性能推理系统,豆包模型API服务在保障高并发的同时,延迟低至20毫秒。

豆包深度思考模型还上线了多模态版,具备视觉推理能力,能像人类一样对看到的事物进行联想和思考,拓展了智能推理的应用边界。比如,这款模型可以看懂复杂的企业项目管理流程图表,快速定位到关键信息,并能够严格按照流程图,回答客户的问题。在分析航拍图时,能结合地貌特征判断区域开发可行性。

从现场演示来看,上传一份可口可乐财报,豆包深度思考模型能够提取财报中不同区域的营收、增长等关键数据指标,并能够结合这些数据分析不同区域数据表现差异的原因;上传一份西餐厅菜单图片,并给出点餐需求和预算指令,豆包深度思考模型能够推理不同菜品是否符合需求,从而按照开胃菜、主菜、配菜、甜点搭配推荐菜品。

去年5月,字节跳动首次对外发布豆包系列模型。一年以来,豆包系列模型的数量在不断增加,模型的能力也在持续提升。豆包多款主力模型的发布都晚于同行,但还是有其市场认可度。

据火山引擎披露,截至2025年3月底,豆包大模型日均tokens调用量已达到12.7万亿,较去年5月发布时增长上百倍。火山引擎总裁谭待在接受界面新闻等媒体采访时透露,从长期来看,豆包大模型日均tokens调用量百倍甚至更高的增长是有可能的。但未来两三年内,最关键的取决于模型是否有重大突破。

去年,豆包大模型首次对外发布,火山引擎把豆包大模型的定价降低了一个数量级。其中,豆包通用模型pro-32k版,模型推理输入价格不足市面上同规格模型的定价的1%;豆包通用模型pro-128k版,模型推理输入价格比行业价格低95.8%。在谭待看来,基础信息处理能力的提升以及成本的下降让豆包大模型从去年到今年获得了快速增长,今年模型在深度思考能力上的突破又带来新的增长。

火山引擎也在遵循相同的逻辑思考大模型未来的增长点。谭待认为,视觉推理能力以及Agent相关技术能否获得重大突破,是未来几年大模型增长的关键节点。

此次发布豆包深度思考模型,火山引擎正是在押宝这两个新的机会。因为现实世界中的很多应用场景是靠视觉驱动的,豆包深度思考模型具备了视觉推理能力,便可以在更多场景助力企业进行落地应用。

火山引擎更大的野心在于争夺Agent市场的机会。2025年被业界视为“Agent智能体元年”。谭待认为,在多模态深度思考模型的基础上,Agent需要良好的架构和工具,去操作数字世界和物理世界。同时,模型的推理成本和延迟要持续降低,才能推动应用普惠。

为此,火山引擎宣布推出OS Agent解决方案,并演示了由Agent操作浏览器,搜索商品页,实现iPhone比价的任务,甚至由Agent在远程计算机上用剪映进行视频编辑、配乐。

据发布会现场的介绍,OS Agent解决方案包含豆包UI-TARS模型,以及veFaaS函数服务、云服务器、云手机等产品,实现对代码、浏览器、电脑、手机以及其他Agent的操作。其中,豆包UI-TARS模型将屏幕视觉理解、逻辑推理、界面元素定位和操作整合在一起,突破传统自动化工具依赖预设规则的局限性,为Agent的智能交互提供了更接近人类操作的模型基础。

好的模型和工具能够加速Agent的落地,但Agent也会带来更大量的模型推理消耗。面对大规模推理需求,火山引擎还有AI云原生ServingKit推理套件,让模型部署更快、推理成本更低,GPU消耗相比传统方案降低80%。

谭待在接受媒体采访时表示,聊天和信息处理只是AI应用的一小部分,AI要真正为各行各业带来变革,Agent是必经之路。对于垂直类Agent,火山引擎会基于自身优势领域进行探索;对于通用型Agent,火山引擎更重要的是搭建好基础框架、提供好用的工具。

IDC发布的《中国公有云大模型服务市场格局分析,1Q25》显示,火山引擎以46.4%的市场份额位居第一。

豆包大模型去年率先降价对火山引擎的增长提供了积极助力,火山引擎也希望通过Agent应用增长的机会获得更大的市场份额。谭待表示,每一次大的模型突破都肯定能激发一次大的变化,他对未来2年内豆包大模型的调用量能否再翻100倍保持谨慎乐观。

主题测试文章,只做测试使用。发布者:人脑网,转转请注明出处:https://www.rennao.com.cn/6866.html

(0)
人脑网的头像人脑网
上一篇 2025年4月18日 下午3:11
下一篇 2025年4月18日 下午3:13

相关推荐

  • 快讯丨贾跃亭:FF市值达到百亿美元基本能还完中国债务

    4月26日,Faraday Future(以下简称FF)联席CEO贾跃亭在接受《每日经济新闻》记者采访时表示,把FF带回中国是他的重大使命之一。“本人也希望能够在FF成功的时候,能够真正的实现还债回国。”贾跃亭称,只要FF的市值能够达到百亿美元,他在中国法律下的债务基本上能够解决完。 据贾跃亭透露,在美国和中东市场取得成功后,FF旗下第二品牌车型将率先回到中…

    2025年4月26日
    500
  • 谁才是地表最强“钢铁侠”?人形机器人马拉松大赛即将揭晓答案!

    明日(4月19日)上午7点半,全球首个人形机器人半程马拉松将在北京亦庄开跑。从4月9日开始,来自全国多个城市的近20支赛队陆续抵京报到。不同型号、技术、尺寸的人形机器人将在21.0975公里长的半马赛道上,展示技术成果,验证技术方案,挑战技术极限。 在这场比赛中,近20支机器人“跑团”将在全程超21公里的赛道上展开角逐,其中宇树科技、北京具身智能机器人创新中…

    2025年4月18日
    1500
  • 波音证实中国已停止接收新飞机,或将另寻买家

    4月24日,据第一财经,今天上午,一架尚未交付国航的波音737Max飞机从舟山波音完工中心起飞,目的地是波音总装厂所在地西雅图。这是一周内第三架被退回的波音飞机。吉祥航空也确认推迟接收原本要交付的波音787飞机。 此前,据央视援引媒体消息,航班跟踪数据显示,今年3月刚刚抵达舟山交付中心的一架波音飞机已于4月18日返回美国。4月21日另一架即将交付的波音737…

    2025年4月24日
    500
  • 6600mAh!电池最大“Ultra”来了

    今年的努比亚,简直像换了个营销团队!往年佛系低调的预热风格不见了踪影,每张海报都像是带着“火药味”,直戳竞品痛点,凶得不行! 4月21日,努比亚又扔出一枚重磅炸弹——官方海报直接公布了努比亚Z70S Ultra摄影师版的杀手锏:6600mAh超大电池!海报宣传语还阴阳怪气地加了句小字:“1台≈1台友商Ultra+一台相机”。 好家伙,这不就是在说“在座的各位…

    2025年4月21日
    900
  • vivo X200s:均衡“全能旗舰”逼近!

    说实话,vivo X200s明明只是个半年小迭代,但这升级幅度实在是太夸张!现在社交平台上的讨论热度,愣是跟“超大杯”vivo X200 Ultra不相上下,简直有点“喧宾夺主”的意思。 4月20日, vivo线下体验店已经陆续放出了X200s的体验机,经过我们几位同事的试玩,大家一致认为,这款新机的配置均衡程度简直是均衡它爸给均衡开门——均衡到家了! 先说…

    2025年4月21日
    900

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信