<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Qwen - 标签 - 探索云原生</title><link>https://www.lixueduan.com/tags/qwen/</link><description>探索云原生（微信公众号：探索云原生）,「江湖人称指月小筑」是意琦行的技术博客。一个云原生打工人的探索之路，专注 Kubernetes、云原生、AI Infra、Go，坚持分享最佳实践、经验干货。</description><generator>Hugo 0.149.0 &amp; FixIt v0.4.0-alpha-20250831070510-5a66a050</generator><language>zh-CN</language><managingEditor>xueduan.li@gmail.com (意琦行)</managingEditor><webMaster>xueduan.li@gmail.com (意琦行)</webMaster><lastBuildDate>Mon, 30 Mar 2026 20:00:00 +0000</lastBuildDate><atom:link href="https://www.lixueduan.com/tags/qwen/index.xml" rel="self" type="application/rss+xml"/><item><title>Qwen3.5 选型 + vLLM 部署实战：从 0.8B 到 397B，哪款最适合你？</title><link>https://www.lixueduan.com/posts/ai/16-deploy-qwen35-by-vllm/</link><pubDate>Mon, 30 Mar 2026 20:00:00 +0000</pubDate><author>xueduan.li@gmail.com (意琦行)</author><guid>https://www.lixueduan.com/posts/ai/16-deploy-qwen35-by-vllm/</guid><category domain="https://www.lixueduan.com/categories/ai/">AI</category><description>&lt;p&gt;&lt;img loading="lazy" src='https://img.lixueduan.com/ai/cover/deploy-qwen35-by-vllm.jpeg' alt="deploy-qwen3.5-by-vllm.jpeg"&gt;&lt;/p&gt;
&lt;p&gt;Qwen3.5 是阿里云最新开源的大语言模型系列，提供了从 0.8B 到 397B 的多种规格，在推理能力和效率之间取得了良好平衡。&lt;/p&gt;
&lt;p&gt;面对如此丰富的模型规格，该如何选择？本文将首先分析各规格模型的特点和适用场景，帮助你找到最适合的那一款，然后介绍如何使用 vLLM 在 Kubernetes 环境中部署 Qwen3.5 模型。&lt;/p&gt;
&lt;p&gt;根据各大榜单排名以及实测表现，Qwen3.5 系列在性能和质量的权衡上表现出色。&lt;/p&gt;
&lt;p&gt;&lt;img loading="lazy" src='https://img.lixueduan.com/ai/vllm/qwen35-rank.png' alt="qwen35-rank.png"&gt;&lt;/p&gt;</description></item></channel></rss>