“1块钱不错买200万tokens,颠倒于5本《新华字典》的翰墨量”,听到阿里云智能集团资深副总裁刘伟光先容通义千问降价细目时,业内东谈主士柔声密谈“这是针对字节卓著吗?”
5月21日上昼,阿里云告示通义千问主力模子Qwen-Long,API(诓骗才智编程接口)输入价钱从0.02元/千tokens降至0.0005元/千tokens,降幅97%,下昼百度拿出两款主力大模子免费对外。
一般来说,一个汉文词语、英文单词、数字、绚烂计为1个token。全网比价的话,字节卓著旗下的豆包大模子更新了价钱清单,“1块钱能买到豆包主力模子的125万tokens,颠倒于三本《三国小说》”,加上Kimi、智谱近期分手在变现和订价上的新算作,这场大模子价钱战不亚于一场618。
降价和免费
“不行说是字节卓著拉动了价钱战,在它之前智谱大模子还退换了价钱呢”,从业者樊帆(假名)也说不上大模子厂商是何时开打价钱战的,但他和行业不雅察者在5月21日都主张感受到了各家的炸药味。
“击穿各人底价”“性价比之王”,刘伟光先容通义千问大模子降价细节时,配景上出现了几个大字,配合着大模子Qwen-Long和同类居品的价钱对比图。
按照阿里云提供的信息,Qwen-Long是通义千问的长文本增强版模子,高下文长度最高达1000万。除了输入价钱降至0.0005元/千tokens,Qwen-Long输出价钱直降90%至0.002元/千tokens。比拟之下,外洋的GPT-4、Gemini1.5Pro、Claude3Sonnet以及国内的Ernie-4.0每千tokens输入价钱分手为0.22元、0.025元、0.022元及0.12元。
几个小时后,百度也发了大招,告示文心大模子的两款主力模子 ENIRE Speed、ENIRE Lite全面免费,即刻奏效。笔据官方先容,ENIRE Speed是百度2024年最新发布的自研大讲话模子,通用才智优异,适配合为基座模子进行精调,更好地贬责特定场景问题,同期具备极佳的推感性能。ENIRE Lite是百度自研的轻量级大讲话模子,合适低算力AI加快卡推理使用。这两款大模子均搭救客户向大模子进行8K-128K内容量的发问+陈说。在官宣免费的推文中,百度智能云将输入和输出价钱都用红色标注为“免费”。
上前倒推,字节卓著旗下的火山引擎在5月20日半夜更新了订价细目。笔据火山方舟大模子行状平台公布的信息,按大讲话模子后付费模式,即以tokens使用量(输入文本+输出文本)计费,每小时出账,按量后付费,其中Doubao-lite-32k模子的免费额度是50万tokens,推理行状输入价钱是0.0003元/千tokens,输出价钱是0.0006元/千tokens。
最新时间才收费
用廉价招引客户的不啻阿里云、百度和字节卓著。
北京商报记者登录腾讯云官网发现,混元生文大模子hunyuan-pro、hunyuan-standard-256k等4个居品正在6.9折促销,混元生图大模子1000、1万次、10万次资源包的优惠力度分手是8折、7.5折、7折。
还有更潜伏的信号。5月6日,幻方量化旗下DeepSeek发布第二代MoE(大师模子)DeepSeek-V2,API订价每百万tokens输入1元、输出2元(32K高下文),价钱为GPT-4-Turbo的近百分之一。5月13日,智谱大模子怒放平台上线新的价钱体系,初学级居品GLM-3 Turbo模子调用价钱下调80%。随后OpenAI推出的GPT-4o,价钱为GPT-4 Turbo的一半,借钱炒股输入、输出每百万tokens收费5好意思元、15好意思元。
回看国内,上周豆包大模子用1块钱买125万tokens,颠倒于三本《三国小说》的对比,让大模子价钱战出了圈。
谈到这次大模子价钱战,易不雅结伴东谈主、易不雅企业数字化中心总司理张澄宇告诉北京商报记者,“大模子的发展一经超越了传统的摩尔定律框架,性能迭代速率相等快,频繁每半年足下性能就会翻倍,而且这一周期仍在镌汰,这是前所未有的。大模子的资本下落不仅依赖于硬件资本的责问,还触及到算法优化和模子锤真金不怕火、部署时间的提高。举例,通过剪枝、量化和常识蒸馏等时间,不错权臣责问诡计复杂度和资源浮滥”。
文渊智库首创东谈主王超也拿大模子的发展和摩尔定律类比,他觉得“大模子一定会降价,只好最新的时间才能收费”。
客户越多越吃亏?
token,即当然讲话模子贬责文本的最小单元。“长文本仅仅大模子竞争的维度之一,用字典、西纪行的文本量来比拼是营销技巧,卷token的性价比内容上是无效的,应该卷多模态、识别、交融等。现在中国大模子都是赔钱营销,谁的用户范围大,谁亏本的更多”,王超告诉北京商报记者。
针对大模子客户范围,北京商报记者分手向阿里云、百度智能云和火山引擎方面发问,物化发稿,阿里云和百度智能云未骄贵具体数据,火山引擎筹商负责东谈主告诉北京商报记者,“豆包大模子一经与手机、电脑、汽车、金融、消费等畛域的头部厂商树立配合,但由于居品刚刚珍惜发布,还处于相等早期阶段,企业客户范围尚小”。
“阿里云处在相等痛苦的位置,宏大的用户,形成它在价钱有盘算、补贴时,没法像其他厂商不异机动,即便它一再宣扬降价,但内容上很容易被船小好调头的敌手超越”,王超向北京商报记者暗意。
张澄宇的不雅点是“价钱竞争是动态变化的,大模子的中枢客群不是价钱明锐型用户。竞争关节在于谁能更好地均衡资本和用户价值”。
关于Kimi尝试的“打赏”变现模式,业内东谈主士多暗意信服,“这意味着大模子厂商正在探索千般化的变现样式,不仅局限于传统的会员订阅和API调用收费,还探索通过用户互动和升值服求末端变现,这有助于加快行业生意闭环的末端”,张澄宇说。
皆集正在升级的价钱战,王超鞭辟入里:“大模子一定会对C(用户)端收费。若是不敢收费,要么对我方的时间莫得信心,要么对改日的判断失去了标的。打价钱战,会让公司对C端收费越来越推迟,也会推迟公司造血功能,只可依赖公司的融资去获取客户。互联网免费后收费叮咛,不合适大模子竞争。”
热点资讯