1) 通用计算(CPU/内存)

  • vCPU / core:虚拟 CPU,通常≈一条超线程。

    • 计费常用 vCPU-second / vCPU-hour(也会按整机“实例小时”计费)。

  • Kubernetes CPU:以 cores / millicores(1 CPU=1000m)做配额;内存用 MiB/GiB

  • CPU Credits:突发型实例(如 AWS T 系)用“积分”表示累积的 CPU 使用额度。

  • 内存:GiB(2^30 B)/ GB(10^9 B),注意二者不同。

2) 加速器(GPU/TPU/NPU)

  • GPU 数量(卡数)与 显存容量(GB/GiB)

  • FLOPS / TFLOPS / PFLOPS:浮点算力(随精度不同而变:FP32、BF16/FP16、INT8…)。

    • 推理常见 TOPS(INT8/INT4 张量运算/秒)。

  • GPU-hour / TPU core-hour:训练/推理最常见计费单位。

3) Serverless(无服务器)

  • GB-second:内存×时长(如 AWS Lambda、Azure Functions);有的还计 vCPU-second(如 Cloud Run)。

  • 还会叠加 请求数出网流量等计费维度。

4) 大数据 / 数仓的“抽象算力单位”

  • BigQuery Slot:并行执行配额(slot-hour)。

  • Snowflake Credit:虚拟仓库规格×时长(credit-hour)。

  • Databricks DBU:每工作负载/节点规格×时长(DBU-hour)。

  • Azure Synapse DWU:数据仓库单位(DWU-hour)。

  • AWS Glue DPU:数据处理单元(DPU-hour)。

  • Redshift Serverless RPUOpenSearch Serverless OCUKinesis KPU 等:各服务自定义“算力单元”。

5) 网络与存储相关

  • 带宽:Gbps。

  • IOPS / 吞吐:读写次数/秒、MB/s(块存储/文件存储常见)。

  • 吞吐式计费:如 Athena/Query 按扫描字节数(GB/TB)计费。

6) 相对性能指标(做对比,不直接计费)

  • SPECint/SPECfp、云厂商的相对指标(如 ACU/ECU〈已过时〉)——用来横向比较实例/代际性能。

7) 常见“单位 × 时间”的计费口径

  • vCPU-hour / vCPU-secondGPU-hourslot-hourDBU-hourDPU-hourDWU-hourRPU-hourGB-second 等。

8) 小例子(换算感知)

  • 2 vCPU 运行 15 分钟 ⇒ 2 × 15min = 0.5 vCPU-hour

  • 100 个 BigQuery slots 跑 1 小时100 slot-hours

  • 100 万次 Lambda,每次 1.5 GB × 2 s ⇒ 1,000,000 × 1.5 × 2 = 3,000,000 GB-seconds(≈ 833.33 GB-hours)。

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐