速卖通素材
努力

阿里百炼Token Plan团队版能使用qwen3.7-max模型吗?

服务器

可以的,阿里云百炼 Token Plan 团队版支持使用 qwen3.7-max 模型

这个模型已经在 2026 年 5 月正式上线百炼平台,并且已经纳入了 Token Plan 的 Credits 统一抵扣体系。 你可以直接在套餐内调用它。

不仅如此,现在使用 qwen3.7-max 还有两个对你很有利的新政策:

🎁 限时五折与隐式缓存

  • ✅ Credits 消耗减半(限时)
    为了让你能更低成本地体验这个旗舰模型,即日起至 2026年6月22日 24:00 (UTC+8),通过 Token Plan 调用 qwen3.7-max 所消耗的 Credits 直接减半

    这意味着,在这段时间内,同样的 Credits 额度可以让你进行两倍量的模型调用。

  • ⚡️ 自动开启隐式缓存(最高省 80% 输入成本)
    在编程和长文本处理的场景中,qwen3.7-max 会自动开启隐式缓存功能。

    • 当模型重复处理相同的上下文时(比如反复分析同一段代码库),系统会自动识别缓存。

    • 命中缓存的输入部分,费用仅为原价的 20%,相当于直接免去了 80% 的输入成本。

    • 这个功能是自动开启、无需额外配置的,对开发者非常友好。

🚀 如何通过 Token Plan 使用?

配置非常简单,你只需要在调用时,将 model 参数指定为 qwen3.7-max 即可,base_url 和 api_key 沿用你 Token Plan 团队的专属配置。

下面是一个 Python 调用的代码示例,供你参考:

python
import os
from openai import OpenAI

# 使用你的 Token Plan 专属 API Key (通常以 sk-sp- 开头)
client = OpenAI(
    api_key=os.getenv("YOUR_TOKEN_PLAN_API_KEY"),
    base_url="https://token-plan.cn-beijing.maas.aliyuncs.com/compatible-mode/v1",
)

# 调用 qwen3.7-max 模型,额度会从你的团队套餐中扣除
response = client.chat.completions.create(
    model="qwen3.7-max",
    messages=[
        {"role": "system", "content": "你是一个专业的AI编程助手。"},
        {"role": "user", "content": "帮我写一个 Python 脚本,实现多线程文件下载功能。"}
    ],
    stream=True # 使用流式输出体验更佳
)

# 处理流式响应
for chunk in response:
    if chunk.choices[0].delta.content is not None:
        print(chunk.choices[0].delta.content, end="")

提示:Token Plan 仅支持在 华北2 地域使用,请确保你的服务配置在该地域。

未经允许不得转载:轻量云Cloud » 阿里百炼Token Plan团队版能使用qwen3.7-max模型吗?