豆包模型上新，字节继续卷性价比

事实上，

prompt：拳击手被击倒，努力挣扎着站起来，脸上满是汗水和倔强。

大家常常忽略的是，

Seedance 1.0 Pro在情绪这一块没有做到极致，但比起过去同类模型，它已经迈出了一大步。表情控制能力还在进化中，细节依然有局限，比如嘴角和眼角的肌肉反应不够细腻，面部变化也不总是连续的。但它确实兼容表现出“笑、忧虑、惊恐、紧张、坚定”这些基础情绪，而且不是固定脸谱，而是能随着上下文变化表现方法。

这次模型发布之后，Seedance已经接入了即梦（视频3.0 Pro）和豆包APP（底部的「照片动起来」），使用者兼容直接采取，也兼容通过火山引擎API接入自己的业务。在价格上也比较低，每千tokens只需1分5，相当于每条5秒视频大概3.67元。在大批量视频需求下，这个成本属于比较可控的范围。

不过，Seedance目前仍然有一些限制。比如生成时长基本控制在10秒以内，镜头切换虽然兼容了2-3个，但还没看到更繁琐脚本的能力。生成也不是很稳定，想要得到满意的视频，无法摆脱多roll的命运。。

1点资讯消息：

豆包1.6:

请记住，

在多模态和执行上迈了一步

再来看豆包1.6，这是这次发布中更偏向通用模型的更新。它主要更新了三个版本：主力版（doubao-seed-1.6）、深度思考版（doubao-seed-1.6-thinking）和极速版（doubao-seed-1.6-flash）。豆包1.6整体能力进入第一梯队，在多项权威评测中得分提升明显，尤其蓝莓外汇平台是数学和推理相关任务。

说出来你可能不信，

具体来看，这一代模型加强了边想边搜和DeepResearch能力。现在诸位兼容从火山引擎的AI体验中心试用。

反过来看，

使用者兼容直接请求它完成某些繁琐任务，模型兼容拆分任务、搜索资料、提炼材料，最后生成报告。这类模块大家在GPT-4和Claude里也能看到，不过豆包的方法更适合国内使用者，点开即用，不需要熟悉繁琐执行流程。

需要注意的是，

豆包1.6最强的还是多模态的实用能力。不是说能识图、能看视频就算多模态，而是把这些能力落到具体场景里。

反过来看，

这类任务不只依赖语言生成，而是能把图像、动作、提示词之间的信息整合起来，而豆包1.6确实在这个方向上做了一些实用尝试。

值得注意的是，

另一个值得一提的点是执行能力。AgentKit现在兼容图形画面执行，兼容打开网页、填写表单、浏览图片、下单预定。

比如输入“打开豆瓣电影，找今天在北京正在上映的电影，挑选一部评分最高的，打开购票页面并截图停留。”它会依次打开网站、查找电影、筛选条件，最后再确认下单。这种模块的完成度已经不低，适合做一些流程重复、逻辑明确的轻任务。

价格方面，豆包1.6也重新定了策略。现在所有任务都采用统一定价模型，不管是文字生成还是图像分析，价格按输入长度划分，最常见的0-32K区间是输入0.8元/百万tokens，输出8元/百万tokens。和豆包1.5比起来，综合成本降低了大约63%。轻松说，价格更接近豆包1.0，但能力是它的多倍。

概括一下，

OpenAI 卷能力，字节在卷什么？

可能你也遇到过，

这次更新背后，其实是字节模型策略的一种延续。它并没有在单一模型参数上卷得特别凶，而是强调组合能力和产品落地。

1点资讯播报

简而言之，

在To C端，豆包已经在做APP化，用“聊天+程序”的形态把模型包装起来；而在To B端，它依托火山引擎呈现一整套AI服务，从基础模型API到完整化解方案。字节大模型的更新节奏不是盲目提速，而是配合业务程序一起同步走，比如最近更新的PromptPilot（提示词调优程序）、AgentKit（智能体开发平台）、多模态工作台、甚至是视频生成场景的Seedance，都和模型不是割裂的，而是集成式设计。

1点资讯消息：

这和OpenAI、百度的路线相比，是有差异的。OpenAI继续把重点放在通用性极强的超级模型上，比如GPT-4o就把语音、图像、文字合成成一个统一的输入输出逻辑，目标是成为人类画面；百度虽然也做了很多产业链整合，但仍保留较多平台化概念，部分场景需要开发者二次拼装。

据业内人士透露，

字节已经不是在卷模不模型的事情了，而是在卷能不能用起来的事情。

在这点上，它有点类似微软Copilot那一套逻辑，但又有自己的中国式打法。微软的优势是Office生态绑定企业，而字节的打法是基于材料+程序的双生态：一边用材料业务抖音等检验模型生成能力，另一边用火山引擎输出服务，把能力变成服务，最终变成一个系统级产品。

而且，从内部资源分配来看，字节的策略也很清晰：模型团队不单打独斗，很多模块直接协同产品线出需求，比如语音播客、视频生成、搜索介绍，这样模型迭代就不是闭门造车，而是从一启动就和实际场景挂钩。

1点资讯消息：

大厂AI模型启动加速奔跑

从某种意义上讲，

聊到这里，其实绕不开的一个困扰就是：现在这些大厂在AI这件事上，到底卷到什么程度了？

这你可能没想到，

从阿里、腾讯到字节，确实都在提速，而且每家的方向有点不一样。

令人惊讶的是，

阿里的重心放在模型规模和通用能力，比如Qwen家族主打大上下文和程序链，目标是拉齐OpenAI那一套能力，尤其强调开源这一点

请记住，

腾讯更多强调业务融合，Agent部署做得早，重点是To B场景，比如政务、企业服务等，推出了元器这种产品

1点资讯认为：

而字节这边，很明显是以材料和多模态作为核心阵地，从豆包模型、Seedance视频、再到语音播客，都是围绕材料生成和产品应用来做的。

它们走的路线不太一样，但节奏都快。诸位会发现，这一年里，模型迭代不再是每半年一次，而是每两三个月就来一波。有的是版本更新，有的是新产品挂钩。但共同点就是，大家都已经不是在比有没有，而是在比用得起、用得上、用得快。

1点资讯认为：

而且有个趋势也挺明确的：AI已经不是实验室里跑分的东西了。诸位发布一个模型，别人不再只关心诸位的推理速度和BLEU分，而是问一句——能不能挂到网页上？能不能在手机里跑？价格怎么样？是不是能直接接到现有系统里？

综上所述，

从这个角度看，字节这波模型更新虽然没有太多行业第一的技术噱头，但确实做得比较扎 TMGM外汇官网实。不管是Seedance的视频质量，还是豆包1.6的多模态能力，起码给到了一些兼容拿去用的东西。对于开发者也好，中小企业也好，现在更在意的是这些东西能不能用、成本怎么样、部署繁琐不繁琐，而不是诸位参数多大。

概括一下，

于是到头来，大厂在AI这场竞争里，其实比的不是谁先造出最强的大模型，而是谁先把模型做成产品，谁先让使用者真正用起来，谁能在不增加采取门槛的前提下，撑住规模和成本。

现在这个阶段，大家都还在跑，但已经能看出几个不同方向的势能了。接下来要看的，也许不是谁先出GPT-5级别的模型，而是谁能真正把AI塞进每一个具体应用场景里，让它像水电网那样成为基础设施。谁做得越快、越稳，就越可能在这场AI基础设施竞赛里，走得更远。