安捷情色 一张图看懂大模子性价比:材干、价钱、并发量全面PK
发布日期:2024-10-11 00:19 点击次数:145
最近安捷情色,国内云厂商的大模子掀翻一场降价风暴。火山引擎、阿里云、百度云等纷繁告示降价,部分模子价钱降幅据称高达99%,以致还有些模子径直免费。
林林总总的降价话术,一眼望去随地黄金。但事实真实如斯吗?今天咱们就拨开迷雾,深挖下大模子降价背后那些事。
动漫xx1
选大模子
要最强版仍是轻量级?
企业采取大模子,最初要明确模子的使用需求:
淌若需要话语意会、生成、逻辑等概述材干强,能处置复杂业务场景问题的大模子,那么必须使用各大头部厂商的最强模子,包括豆包Pro系列、通义千问Qwen-Max系列和文心ERNIE 4.0。这些模子均已卓绝GPT3.5,但距离GPT-4略有差距。
淌若对模子材干条件不高,比如绵薄的对话问答,然则需要反映速率快、低廉的大模子,那么不错使用各家大模子的轻量化版块。包括豆包Lite系列、通义千问Qwen-Long/Plus/Turbo系列、文心ERNIE-3.5/Speed/Lite系列。
选模子就像选车相同,高端商务和家用买菜,笃定不是一个价。初学级的车就算给你倒贴钱,你敢开去跑极限越野吗?是以仍是要调治模子材干,不可光看最廉价。
2安捷情色
比价钱,还要比并发
选好适配业务的模子之后,就要算算使用资本了。
各家大模子公布的x元/千tokens,齐是指“后付费”的刊例价。也便是按照本体使用的tokens算账。
乍看很绵薄——谁的单价低,谁就更低廉呗。但真要用起来,这内部门说念就多了。
和“后付费”价钱绑定在一齐的,有两个重要目的,一个叫TPM(每分钟token数),一个叫RPM(每分钟苦求数)。
TPM,代表着一家企业客户在单元技巧内不详使用的token名额;RPM,代表着一家企业客户在单元技巧内最多能用几许次大模子。两个目的中有一个达到名额,模子就隔断提供作事了。
打个比喻:大模子API调用就像一个洪流池,TPM是死心了每分钟不错打一杯水仍是一桶水,RPM是死心了同期不错来10个东说念主仍是来100个东说念主取水。不管水价多低廉,哪怕是免费的,淌若一分钟只可接一杯水,那也没太大用处。
3
大模子降价“御三家”最戒备对比
搞澄莹大模子价钱那些事儿,接下来望望这波降价潮里最风口浪尖的三家云厂商:最初掀桌的火山引擎和豆包大模子,火上浇油的阿里云和通义千问大模子,摔杯免费的百度智能云和文心大模子。
以上数据均来自于各厂商官网及家具步骤台,数据收集技巧为5月22日。如有变动,以厂商最新公告为准。
为了更直不雅地发达以上大模子的概述性价比,咱们按照模子材干分级,推断一元钱能购买的tokens数目,以及不同模子复古的并发材干,分散作念成图表。
备注:在典型流量场景中,推理输入弘大于推理输出,一般为5比1到10比1之间。在长文本对话的PDF回想节录等场景,输出比较输入更是不错忽略。因此本文以推理输入价钱为准,推断一元钱能买到的tokens数目。
4
绵薄回想
百度最强模子的价钱不变,但轻量模子把“厘时间”径直打到免费。不外需要提神的是,凭据文心一言官网先容,ERNIE Speed模子适用于精调,而精调仍是要收费的。
阿里云的模子全线降价,最强模子降幅低,轻量模子降幅高。通盘价钱应该齐是经由了精密的测算,不会是浪漫拍的数。从价钱来看仍是颇有忠心,但动手复古的TPM/RPM稍显不及,企业在本体使用中需要对相干权柄作念好相通。
字节,火山引擎。当咱们提及价钱那些事儿,不由念念起《明朝那些事儿》的经典台词:要么不作念,要么作念绝。豆包大模子闷声发育一年,不管是最强模子仍是轻量模子,TPM仍是RPM,用九个字不错刻画:不留空档,竞争力拉满。