阿里百炼Token Plan团队版能使用qwen3.7-max模型吗？-轻量云Cloud

可以的，阿里云百炼 Token Plan 团队版支持使用 qwen3.7-max 模型。

这个模型已经在 2026 年 5 月正式上线百炼平台，并且已经纳入了 Token Plan 的 Credits 统一抵扣体系。你可以直接在套餐内调用它。

阿里云百炼Token Plan：https://www.aliyun.com/benefit/scene/tokenplan
Token Plan 概述产品帮助文档：https://help.aliyun.com/zh/model-studio/token-plan-overview

不仅如此，现在使用 qwen3.7-max 还有两个对你很有利的新政策：

🎁 限时五折与隐式缓存

✅ Credits 消耗减半（限时）
为了让你能更低成本地体验这个旗舰模型，即日起至 2026年6月22日 24:00 (UTC+8)，通过 Token Plan 调用 qwen3.7-max 所消耗的 Credits 直接减半。

这意味着，在这段时间内，同样的 Credits 额度可以让你进行两倍量的模型调用。
⚡️ 自动开启隐式缓存（最高省 80% 输入成本）
在编程和长文本处理的场景中，qwen3.7-max 会自动开启隐式缓存功能。
- 当模型重复处理相同的上下文时（比如反复分析同一段代码库），系统会自动识别缓存。
- 命中缓存的输入部分，费用仅为原价的 20%，相当于直接免去了 80% 的输入成本。
- 这个功能是自动开启、无需额外配置的，对开发者非常友好。

🚀 如何通过 Token Plan 使用？

配置非常简单，你只需要在调用时，将 model 参数指定为 qwen3.7-max 即可，base_url 和 api_key 沿用你 Token Plan 团队的专属配置。

下面是一个 Python 调用的代码示例，供你参考：

import os
from openai import OpenAI

# 使用你的 Token Plan 专属 API Key (通常以 sk-sp- 开头)
client = OpenAI(
    api_key=os.getenv("YOUR_TOKEN_PLAN_API_KEY"),
    base_url="https://token-plan.cn-beijing.maas.aliyuncs.com/compatible-mode/v1",
)

# 调用 qwen3.7-max 模型，额度会从你的团队套餐中扣除
response = client.chat.completions.create(
    model="qwen3.7-max",
    messages=[
        {"role": "system", "content": "你是一个专业的AI编程助手。"},
        {"role": "user", "content": "帮我写一个 Python 脚本，实现多线程文件下载功能。"}
    ],
    stream=True # 使用流式输出体验更佳
)

# 处理流式响应
for chunk in response:
    if chunk.choices[0].delta.content is not None:
        print(chunk.choices[0].delta.content, end="")

提示：Token Plan 仅支持在 华北2 地域使用，请确保你的服务配置在该地域。