可以的,阿里云百炼 Token Plan 团队版支持使用 qwen3.7-max 模型。
这个模型已经在 2026 年 5 月正式上线百炼平台,并且已经纳入了 Token Plan 的 Credits 统一抵扣体系。 你可以直接在套餐内调用它。
阿里云百炼Token Plan:https://www.aliyun.com/benefit/scene/tokenplan
Token Plan 概述产品帮助文档:https://help.aliyun.com/zh/model-studio/token-plan-overview
不仅如此,现在使用 qwen3.7-max 还有两个对你很有利的新政策:
🎁 限时五折与隐式缓存
-
✅ Credits 消耗减半(限时)
为了让你能更低成本地体验这个旗舰模型,即日起至 2026年6月22日 24:00 (UTC+8),通过 Token Plan 调用qwen3.7-max所消耗的 Credits 直接减半。这意味着,在这段时间内,同样的 Credits 额度可以让你进行两倍量的模型调用。
-
⚡️ 自动开启隐式缓存(最高省 80% 输入成本)
在编程和长文本处理的场景中,qwen3.7-max会自动开启隐式缓存功能。-
当模型重复处理相同的上下文时(比如反复分析同一段代码库),系统会自动识别缓存。
-
命中缓存的输入部分,费用仅为原价的 20%,相当于直接免去了 80% 的输入成本。
-
这个功能是自动开启、无需额外配置的,对开发者非常友好。
-
🚀 如何通过 Token Plan 使用?
配置非常简单,你只需要在调用时,将 model 参数指定为 qwen3.7-max 即可,base_url 和 api_key 沿用你 Token Plan 团队的专属配置。
下面是一个 Python 调用的代码示例,供你参考:
import os from openai import OpenAI # 使用你的 Token Plan 专属 API Key (通常以 sk-sp- 开头) client = OpenAI( api_key=os.getenv("YOUR_TOKEN_PLAN_API_KEY"), base_url="https://token-plan.cn-beijing.maas.aliyuncs.com/compatible-mode/v1", ) # 调用 qwen3.7-max 模型,额度会从你的团队套餐中扣除 response = client.chat.completions.create( model="qwen3.7-max", messages=[ {"role": "system", "content": "你是一个专业的AI编程助手。"}, {"role": "user", "content": "帮我写一个 Python 脚本,实现多线程文件下载功能。"} ], stream=True # 使用流式输出体验更佳 ) # 处理流式响应 for chunk in response: if chunk.choices[0].delta.content is not None: print(chunk.choices[0].delta.content, end="")
提示:Token Plan 仅支持在 华北2 地域使用,请确保你的服务配置在该地域。
轻量云Cloud