Qwen: Qwen3.5 Plus

qwen3.5-plus

chatQwen

Quick Reference

Input: Text, Image
Output: Text

Context: 1M
Max Output: 65.5K

Input Price: $0.12/M
Output Price: $0.71/M

Author: Alibaba
Version: main
Open Source: Yes

Overview

Qwen3.5 native vision-language Plus model, built on a hybrid architecture combining linear attention and a sparse mixture-of-experts design for higher inference efficiency. Across multiple benchmarks, the 3.5 series delivers exceptional performance comparable to today's leading frontier models, with major leaps over the 3 series in both pure text and multimodal scenarios. This version is functionally equivalent to the snapshot model qwen3.5-plus-2026-02-15.

Input modalities

TextImage

Output modalities

Text

Capabilities

chatreasoningvision

Features

Function Calling

Structured Output

Caching

Batch Processing

Web Search

Prefix Completion

Pricing

Per-token prices for Qwen: Qwen3.5 Plus.

Input <= 128K

Token Type	Price	Unit
Input	$0.12/M	per million tokens
Output	$0.71/M	per million tokens
Cache Read	$0.01/M	per million tokens

Specifications

Context Window

1Mtokens

Max Input

934Ktokens

Max Output

65.5Ktokens

API Reference

OpenAI-compatible endpoint at https://api.inferoute.ai/v1.

import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.inferoute.ai/v1",
    api_key=os.environ.get("INFEROUTE_API_KEY"),
)

try:
    response = client.chat.completions.create(
        model="qwen3.5-plus",
        messages=[
            {"role": "system", "content": "You are a helpful assistant."},
            {"role": "user", "content": "Write a haiku about recursion."},
        ],
        max_tokens=512,
        temperature=0.7,
    )

    print(response.choices[0].message.content)
except Exception as e:
    print(f"Error: {e}")