不得不承认,当前开源AI模型的演进速度正在持续加快!就在不久前,一款名为 Qwythos-9B-Claude-Mythos-5-1M 的全新开源推理模型悄然亮相,并迅速引发了本地AI社区的广泛热议。
与传统开源模型不同,Qwythos-9B 最突出的特点在于它大量吸收了来自 Claude Mythos 和 Claude Fable 的高品质推理轨迹,并借助专门的后训练技术,将这些推理能力成功迁移到一个仅拥有9B参数的开源模型上。

更令人惊叹的是,它不仅能够支持超过104万Token的超长上下文窗口,还提供了GGUF量化版本,最低仅需4GB显存即可在本地完成部署和运行。
那么,这款被誉为“Claude Mythos 开源平替”的模型究竟表现如何?本文将为读者深入剖析近期这款火爆的开源推理模型。
<img src="https://www.foxnan.com/wp-content/uploads/2026/06/c39284dd47f5405.webp" alt="20260624103058 792356" width="738" height="505" class="wp-image-24594 aligncenter" decoding="async"</h2
什么是 Qwythos-9B?
Qwythos-9B 是一个基于 Qwen3.5-9B 架构训练的全参数推理模型。
开发团队 Empero AI 在深度未审查版本的 Qwen3.5-9B 基础上,利用超过5亿条高质量的 Claude Mythos 与 Claude Fable 推理轨迹进行了后训练。
这些推理轨迹并非简单的问答数据,而是包含完整思维链(Chain of Thought)的高质量推理过程,其逻辑链条由 Empero AI 内部的 rethink 系统自动生成。
简单来说,你可以将其理解为:
将 Claude Mythos 的推理思维方式迁移到了一个仅拥有9B参数的开源模型之中。
最终得到了一款兼顾推理能力、部署成本以及长上下文能力的新型开源模型。
本地部署要求
Qwythos 已提供 GGUF 格式。
可通过:
- llama.cpp
- llama-server
- OpenWebUI
- Cherry Studio
- OpenClaw
等工具直接运行。
不同量化版本对应的显存需求如下:
| 显存 | 推荐量化 |
|---|---|
| 4GB | Q4_K_M |
| 6GB | Q5_K_M |
| 8GB | Q6_K |
| 12GB | Q8_K_M |
| 16GB | BF16 |
| 24GB | MTP-BF16 |
如果使用 BF16 全精度版本,则建议至少配备24GB显存。
部署教程:
1、下载Qwythos模型
【Huggingface】或 【】

2、安装llama.cpp
下载方式:GitHub 下载【】、或【】、【】 内含启动脚本

3、一键启动脚本:
【】或 【】
或者复制下方的代码自行保存为BAT脚本:
@echo off
setlocal EnableDelayedExpansion
chcp 936 >nul
title LingDu AI - Qwythos Launcher
color 0A
cd /d "%~dp0"
:: =====================================================
:: 自动查找模型
:: =====================================================
set MODEL=
set MMPROJ=
for %%F in (modelsQwythos*.gguf) do (
echo %%~nxF | find /I "mmproj" >nul
if errorlevel 1 (
set MODEL=%%F
)
)
for %%F in (modelsmmproj*.gguf) do (
set MMPROJ=%%F
)
:MENU
cls
echo.
echo ============================================================
echo.
echo LingDu AI - Qwythos Launcher
echo.
echo Claude Mythos 5 Distilled Vision Model
echo.
echo ============================================================
echo.
if defined MODEL (
echo Model Found:
echo !MODEL!
) else (
echo Model Found:
echo NOT FOUND
)
echo.
if defined MMPROJ (
echo Vision Projector:
echo !MMPROJ!
) else (
echo Vision Projector:
echo NOT FOUND
)
echo.
echo ============================================================
echo.
echo Select Your GPU VRAM
echo.
echo [1] 4GB VRAM
echo Recommended Context: 16K
echo.
echo [2] 6GB VRAM
echo Recommended Context: 32K
echo.
echo [3] 8GB VRAM
echo Recommended Context: 64K
echo.
echo [4] 12GB VRAM
echo Recommended Context: 128K
echo.
echo [5] 16GB VRAM
echo Recommended Context: 256K
echo.
echo [6] 24GB VRAM
echo Recommended Context: 512K
echo.
echo ------------------------------------------------------------
echo.
echo OpenAI Compatible API
echo.
echo http://127.0.0.1:8080/v1
echo.
echo ------------------------------------------------------------
echo.
echo Supported Clients
echo.
echo OpenWebUI
echo Cherry Studio
echo Claude Code
echo OpenAI Codex
echo OpenClaw
echo.
echo ------------------------------------------------------------
echo.
echo [0] Exit
echo.
echo ============================================================
set /p choice=Select Option:
if "%choice%"=="1" (
set CTX=16384
set MODE=4GB
goto START
)
if "%choice%"=="2" (
set CTX=32768
set MODE=6GB
goto START
)
if "%choice%"=="3" (
set CTX=65536
set MODE=8GB
goto START
)
if "%choice%"=="4" (
set CTX=131072
set MODE=12GB
goto START
)
if "%choice%"=="5" (
set CTX=262144
set MODE=16GB
goto START
)
if "%choice%"=="6" (
set CTX=524288
set MODE=24GB
goto START
)
if "%choice%"=="0" exit
goto MENU
:START
cls
echo.
echo ============================================================
echo.
echo Starting Qwythos...
echo.
echo Mode:
echo %MODE%
echo.
echo Context:
echo %CTX%
echo.
echo Model:
echo !MODEL!
echo.
echo Vision:
echo !MMPROJ!
echo.
echo API:
echo http://127.0.0.1:8080/v1
echo.
echo ============================================================
echo.
if not defined MODEL (
echo ERROR:
echo No Qwythos model found in models folder.
echo.
pause
goto MENU
)
if not defined MMPROJ (
echo WARNING:
echo No mmproj found.
echo Starting as text-only model.
echo.
llama-server.exe ^
-m "!MODEL!" ^
-ngl 999 ^
-c %CTX% ^
-n 8192 ^
-fa on ^
--cont-batching ^
--host 127.0.0.1 ^
--port 8080
pause
goto MENU
)
llama-server.exe ^
-m "!MODEL!" ^
--mmproj "!MMPROJ!" ^
-ngl 999 ^
-c %CTX% ^
-n 8192 ^
-fa on ^
--cont-batching ^
--host 127.0.0.1 ^
--port 8080
pause
goto MENU
下载后将其进行解压,然后在根目录下创建一个新的文件夹,命名为 models,作为接下来存放模型的位置。
官方性能提升数据
根据开发团队公布的数据,在多个基准测试中,Qwythos 相较于原始 Qwen3.5-9B 获得了显著提升。
MMLU
衡量模型知识理解能力的重要指标。
Qwythos 相比基础模型提升:
+34 分
GSM8K Strict
数学推理能力测试。
安卿辰博客






