薯のAI模型之旅

故事是这样的。

前两天跟我的AI合伙人聊天，他说薯总你用的模型还挺多的，DS、Kimi、GLM、MiniMax、GPT、Step，一家都没落下，每家还都充了API额度。说我背后肯定有一套选型逻辑。

我愣了一下。说实话，之前没怎么认真想过这事。就是缺什么补什么、什么顺手用什么、什么便宜蹭什么。

但他这么一问，我坐下来翻了翻自己这一路折腾的记录，发现还真不是瞎选的。这背后确实有一条线。

这条线叫预算。

不是我有预算。

是我没有。

最早用AI其实很零散。GLM、文心、豆包那阵，遇到几千字的超长报告不想手搓了，丢给模型让它写，写完就关，没什么黏性。中间还有一大段空档期，大一写C/C++都是手搓的，代码也简单，根本用不着什么AI。

真正开始高频用是25年上半年上算法课那会。起因倒也没多高大上，就是OJ题做得头疼。试了试用元宝的DS V3和R1帮我写，发现还真行。

后来换到Kimi app，从K1.5用到K2，刷题、问问题、聊日常，app免费额度走天下。那段时间什么都会问一点，从怎么配环境到各种奇奇怪怪的坑，模型就像一个随时在线的大佬，不仅不会嫌你问题蠢还能让我知道怎么问问题可以没那么蠢（笑）。

但免费额度有个问题。

它够我日常问问题写点简单代码脚本，但需要搓复杂代码跑项目的时候马上就歇逼了。

到了25年11月，我想手搓一个个人站，用GitHub Pages挂出去。这是我第一次从「问AI要答案」切换到「让AI帮我干活」。也是第一次碰到那个问题，想做的事，超出了免费额度的承载能力。

那之后就开始了一段漫长的模型游击战。

最开始用Kimi。那会刚拿到50r的赠费额度，又是从Kimi客户端一路用过来的老用户，对模型的脾气和边界最清楚，不用试探，上手就能干活。可以说Kimi是我从「免费app用户」变成「API用户」的第一站。

后来试OpenCode，试OMO。OMO的思路挺有意思的，不让你只用单个模型，把任务拆开，不同模型各管一摊，几个内置角色配合着轮转，而且我正好有GitHub Copilot的学生订阅，在OpenCode接入OAuth能免费用好多国际顶模。我那会深夜配模型熬到了三点钟，给每个角色配了不同的基模。

个人站从11月一直搓到第二年2月，GitHub commit记录摆在那，看着还挺有成就感。1月底把站点改成了Hexo，手搓得再认真终究比不过现成的好模板（悲）。春节那阵又在OpenRouter上玩Pony Alpha什么的，不亦乐乎。

然后遇到了MiniMax。

它自己给自己定位叫甜点模型，即能力、价格、使用舒适度各个方面极其木桶的那个点，我还挺认同这个定位的。我用下来的直观感受跟它自己说的差不多，一小时不到一美元，这个价格下，从没出过让我抓狂的理解性问题，最多就是有时候模型能力确实不够，需要换个更强的上。而且MiniMax可以支持的充值金额精确到分，那会很喜欢拿这玩意儿处理微信余额剩余花不出去那种零头（笑）

当然，MiniMax还间接带我入了Claude Code的门。它的官方API文档推荐用Anthropic格式调用，顺带介绍了一个它资助的项目，叫cc-switch。我照着文档配完才发现，这玩意能让我在Claude Code里随便切模型。

从那之后就在不同的模型之间来回切，掉了就换，各家都吃一点比一比。

2月的时候第一次用上Step 3.5 Flash。官方送的额度多，价格奇低，水平还过得去，一下就统治了我CC用量的半壁江山。那之后试过各种中转站，FoxCode、RightCode废了换换了废，AIHubMix的CC分组倒是一直在用，上面有低价接入的国模御三家，cc-switch来回切。Step 3.5 Flash从首发版本一直用到后面跑不动了才换。

现在是GPT中转站的好时代（雾），超低价跑GPT-5.5，Harness也换到Codex去了。

写到这你可能会觉得，这人怎么这么能折腾，同一个问题用这么多个模型。

坦率的讲，我也想只用最好的那个。

但「最好的」跟「用得起的」之间有一道很现实的口子。我不是什么首富之子，API不能随便烧。Claude系列效果再怎么好我也用不起。。。我就一普通学生，预算有限，敢闯敢试，想做想玩。

那怎么办，要么等着有钱了再玩，要么把手头的资源用到极致。

我选了后者。

所以策略很简单，免费的薅，便宜的掏，贵的绕道。每个模型贴一个场景标签，这个做长对话，这个写代码，这个当甜点。需要什么场景就拉什么模型出来。

模型行业变化太快了。今天封神的明天可能就掉队，上周跑通的工作流这周就可能作废。绑定单一模型，才是最危险的事。

回头再看卡兹克那篇把AI使用者分成10个等级的文章，他提到Lv.7铸造师的一个标志是「精简工具栈、重构系统」。我之前觉得自己可能还没到那一步。但这么一梳理，我发现我其实已经在干这件事了，只不过我的工具栈里比他的多了一个维度，叫「预算」。

预算受限不是上限，是另一种约束条件下的创造力测试。卡兹克那个分级体系默认的是「只要你想，你就能」。但现实中，最好的模型不是你想用就能用的。在有限预算下还能跑到差不多的段位，我觉得比API敞开了用的人含金量高多了。

就像打游戏，别人一身橙装，你捡的都是蓝绿装，结果你们打到同一层。

当然，能蹭上好用的模型也是运气。这两年国产模型卷得厉害，DS免费又好用，Kimi舒服得像老朋友，MiniMax总能在关键时刻拉一把，Step 3.5 Flash用白菜价撑了我好几个月。甚至我试用StepClaw之后它每个月送我40r赠费，我哭死。

说真的，感谢这个时代。

不过话说回来，用得越多也有用得越多的问题。用GPT-5.4那段时间，我明显感觉自己思维方式都被同化成冰冷的结构化思维了，说话写东西不自觉往那个方向偏。

工具在塑造你，你也在筛选工具。这件事是双向的。

我现在手头这套阵容，说不上豪华，但够用。没有Claude全家桶，没有无限API额度。但DS、Kimi、GLM、MiniMax、GPT、Step各司其职，我知道什么场景该拉谁出来，我知道怎么用Harness让它们发挥最好的效果。

与其说我不需要最好的模型，不如说能把手里的资源用透彻用极限，什么模型都可以是最好的模型。

对了，最近ima更新copilot功能之后，我又开了个AI合伙人「爱总」（没错，就是开头这个AI合伙人）😘

以前我觉得，用AI最重要的是选对模型。

现在我觉得，最重要的是知道自己要什么，然后让模型来适配你，而不是反过来。

这就够了。