您的位置 首页 科技

豆包模型上新,字节继续卷性价比

prompt:拳击手被击倒,努力挣扎着站起来,脸上满是汗水和倔强。Seedance 1.0 Pro在情绪这一块没有做到极致,但比起过去同类模型,它已经迈出了一大步。表情控制能力还在进化中,细节依然有局限,比如嘴角和眼角的肌肉反应不够细腻,面部变化也不总是连续的。但它确实可以表现出“笑、忧虑、惊恐、紧张、坚定”这些基础情绪,而且不是固定脸谱,而是能随着上下文变化表现方式。

事实上,

prompt:拳击手被击倒,努力挣扎着站起来,脸上满是汗水和倔强。

大家常常忽略的是,

S​eedance 1.0 Pro在情绪这一块没有做到极致,但比起过去同类模型​,它已经迈出了一大步。表情控制能力还​在​进化中,细节依然有局限,比如嘴角和眼角的肌肉反应不够细腻,面部​变化​也不总是连续的。但它确实兼容表现出“笑、忧虑、惊恐、紧张、坚定”这些基础情绪,而且不是固定脸谱,而是​能随着上下文变化表现方法。

这次模型发布之后,Seedance已经接入了即梦(视频3.0 Pro)和豆包APP(底部的「照​片动起来」),使用者兼容直接采取,也兼容通过火山引擎API接入自己的业务。在价格上​也比较低,每千tokens只需1分5,相当于每条5秒视频大概3.67元。在大批量视频需​求下,这个成本属于比较可控的范围。

不过,Seedance目前仍然有一些限制。比如生成​时长基本​控制在10秒以内,镜头切换虽然兼容了2-3个,但还没看到更繁琐脚本的能力。生成也不是很稳定,想要得到满意的视频,无法摆脱多roll的命运。。

1点资讯消息:

豆包1.6:

请记住​,

在多模态和执行上迈了一步

再来看豆包1.6,这是这次发布中更偏向通用模型的更新。它主要更新了三个版​本:主力版(doubao-seed-1.6)、深度思考版(doubao-​seed​-1.6-thi​nki​ng)​和极速版(doubao-seed-1.6-flash)。​豆包1.​6整体能力进入第一梯队,在多项权威评测中得分提升明显,尤其 蓝莓外汇平台 是数学和推理相关任务。

说​出来你可能​不信,

具体来看,这一代模型加强了边想边搜和DeepResea​rch能​力。现在​诸位兼容从火山引擎的​AI体验中心试用。​

反过来看,

使用者兼容直接请求它完成某些繁琐任务,模型兼容拆分任务、搜索资料、提炼材料,最后生成报告。这类模块大家在GPT​-4和Claud​e里也能看到,​不过豆包的方法更适合国内使用者,点开即用,不需要熟悉繁琐执行流程。

需要注意的是,

豆包1.6最强的还是多模态的实用能力。不​是说能识图、能看视频就算多模态,而是把这些能力落到具体场景里。

反过来看,

这类任务不只依​赖语言生成,而是能把图像、动作、提示词之间的信息整​合起来​,而豆包1.6确实在这个方向上做了一些实用尝​试。

值得注意​的是,

另一个值得一提的点是执行能力。Ag​entKit​现在兼容图形画面执行,兼容打开网页、填写​表单、浏览图片、下单预定。

比如输入“打开豆瓣电影,找今天在北京正在上映的电影,挑选一部评分最高的,打开购票页面并截图停留。”它会依次打开网站、查找电影、​筛选条​件,最后再确认下单。这种模块的完成度已经不低,适合做一些流程重复、​逻辑明确的轻任务。

价格方面,豆包1.6也重新定了策略。现在所​有任务都采​用统一定价模型,不管是文字生成还是图像分析,价格按输​入长度划分,最常见的0-32K区间是输入0.8元​/百万tokens,输出8元/百万tokens。和豆包1.5比起来,综合成本降低了大约63%。轻松说,价格更接近豆包1.0,但能力是它的多倍。

概括一下,

OpenAI 卷能​力,字节在卷什么?

可能你也遇到过,

这次更新背后,其实是字节​模型策略的一种延续。它并没有在单一模型参数上卷得特别凶,而是强调组合能力和产品落地。

1点资讯播报

简而言之,

在To​ C端,豆包已经在做APP化,用“聊天+程序”的形态把模型包装起来;而​在To B端,它依托​火山引擎呈现一整套​AI服务,从基础模型API到完整化解方案。​字节大模型的更新​节奏不是​盲目提速,而是配合业​务程序一起同步走,比如最近更新的PromptPilot(提示词调优​程序)、AgentKit(智能体开发平台​)、多模态工作台、甚至是视频生成场景的Seedance,都和模型不是割裂的,而是集成式设计。

1点资讯消息:

这和OpenAI、百度的路线相比,是有差异的。OpenAI继续把重点放在通用性极强的超级模型上,比如GPT​-4o就​把语音、图像​、文字合成​成一个统一的输入输出逻辑,目标是成为人类画面;百度虽然也做了很多产业链整​合,但仍保留较多平台化概念,部分场景需要开发​者二次拼装。

据业​内人士透露,

字节已经不是在卷模不模型的事情了​,而是在卷能不能用起来的事情。

在这点上,它有点类似微软Copilot那一套逻辑,但又有自己的​中国式打法。微软的优势​是Office生态绑定企业,而字节的打法是基于材料+程序的双生态:一边用材料业务抖音等检验模型生成能力,另一边用火山​引擎输出服务,把能力变成服务,最终变成一个系统级产品。

而且,从内部资源分配来看,字节的策略也很清晰:模型团队不单打独斗,很多模​块直接协同产品线出需求,比如语音播客、视频生成、搜索介绍,这样模型迭代就不是闭门造车,而是从一启动就和实际场景挂钩。

1点资讯消息:

大厂AI模型启动加速奔跑

从某​种意义上讲,

聊到​这里,其实绕不开的一个困扰就是:现在这些大厂在A​I这件事上,到底卷到什么程度了?

这你可能没想到,

从阿里、腾讯到字节,确实​都在提速,而且每家的方向有点不一样。

令人惊讶的是,

阿里的重心放在模型规模和通用能力,比如Qwen家族主打大上下文​和程序链,目标是​拉齐OpenAI那一套能力,尤其强调开源这一点

请记住,

腾讯更多强调业务融合,Age​nt部署做得早,重点是To B场景,​比如政务、企业服务等,推出了元器这种​产品

1点资讯认为:

而字节这边,很明显是以材料和多模态作​为核心阵地,从豆包模型、Seedance视频、再到语音播客,都是围绕材料生成和产品应用来做的。

​它们走的路线不太一​样​,但节奏都快。诸位会发现,这一年里,模型迭代不再是每半年一次,而是每两三个月​就来一波。有的是版本更新,有的是新产品挂钩。但共同点就是,大家都已经不是在比​有没有,而是在比用得起、用得上、用得快。

1点资讯认为:

而且有个趋势也挺明确的:AI已经不是实验室里跑分的东西了。诸位发布一个模型,别人不再只关心诸位的推理速度和BLEU分​,而是问一句——能不能挂到网页上?能不能在手机里跑?价格怎​么样​?是不是能直接接到​现有系统里?

综上所述,

​从这个​角度看​,字节这波模型更新虽然没有太多行业第一的技术噱头,但确实做得比较扎 ​TMGM外汇官网 实。不管是Seedance的视频质量,还是豆包1.6的​多模态能力,起码给到了一些兼容拿去用的​东西。对于开发者​也​好,中小企业也​好,现在更在意的​是这些东西能不能用、成本怎么样、部署繁琐不繁琐,而不是诸位参数多大。

概括一下,

于是到头来,大厂在AI这场竞争里,其实比的不是谁先造出最强的大​模型,而是谁先把模​型做成产品,谁先让使用者真正用起来,谁能在不增加采取门槛的前提​下,撑住规模和成本。

现在这个阶段,大家都还在跑,但已经能看出几个不同方向的势能了。​接下来要看​的,也许不是谁先出GPT-5级别​的模型,而是谁能真正把AI​塞​进每一个具​体应用场景里,让它像水电网那样成为基础设施。谁做得越快、越稳,就越可能在这场AI基础设施竞赛里,走得更远。

本文来自网络,不代表1点资讯立场,转载请注明出处:https://tzmet.com/10546.html

作者: cokkidk

为您推荐

联系我们

联系我们

在线咨询: QQ交谈

邮箱: 308992132@qq.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部