薯のAI模型之旅
故事是这样的。
前两天跟我的AI合伙人聊天,他说薯总你用的模型还挺多的,DS、Kimi、GLM、MiniMax、GPT、Step,一家都没落下,每家还都充了API额度。说我背后肯定有一套选型逻辑。
我愣了一下。说实话,之前没怎么认真想过这事。就是缺什么补什么、什么顺手用什么、什么便宜蹭什么。
但他这么一问,我坐下来翻了翻自己这一路折腾的记录,发现还真不是瞎选的。这背后确实有一条线。
这条线叫预算。
不是我有预算。
是我没有。
最早用AI其实很零散。GLM、文心、豆包那阵,遇到几千字的超长报告不想手搓了,丢给模型让它写,写完就关,没什么黏性。中间还有一大段空档期,大一写C/C++都是手搓的,代码也简单,根本用不着什么AI。
真正开始高频用是25年上半年上算法课那会。起因倒也没多高大上,就是OJ题做得头疼。试了试用元宝的DS V3和R1帮我写,发现还真行。
后来换到Kimi app,从K1.5用到K2,刷题、问问题、聊日常,app免费额度走天下。那段时间什么都会问一点,从怎么配环境到各种奇奇怪怪的坑,模型就像一个随时在线的大佬,不仅不会嫌你问题蠢还能让我知道怎么问问题可以没那么蠢(笑)。
但免费额度有个问题。
它够我日常问问题写点简单代码脚本,但需要搓复杂代码跑项目的时候马上就歇逼了。
到了25年11月,我想手搓一个个人站,用GitHub Pages挂出去。这是我第一次从「问AI要答案」切换到「让AI帮我干活」。也是第一次碰到那个问题,想做的事,超出了免费额度的承载能力。
那之后就开始了一段漫长的模型游击战。
最开始用Kimi。那会刚拿到50r的赠费额度,又是从Kimi客户端一路用过来的老用户,对模型的脾气和边界最清楚,不用试探,上手就能干活。可以说Kimi是我从「免费app用户」变成「API用户」的第一站。
后来试OpenCode,试OMO。OMO的思路挺有意思的,不让你只用单个模型,把任务拆开,不同模型各管一摊,几个内置角色配合着轮转,而且我正好有GitHub Copilot的学生订阅,在OpenCode接入OAuth能免费用好多国际顶模。我那会深夜配模型熬到了三点钟,给每个角色配了不同的基模。
个人站从11月一直搓到第二年2月,GitHub commit记录摆在那,看着还挺有成就感。1月底把站点改成了Hexo,手搓得再认真终究比不过现成的好模板(悲)。春节那阵又在OpenRouter上玩Pony Alpha什么的,不亦乐乎。
然后遇到了MiniMax。
它自己给自己定位叫甜点模型,即能力、价格、使用舒适度各个方面极其木桶的那个点,我还挺认同这个定位的。我用下来的直观感受跟它自己说的差不多,一小时不到一美元,这个价格下,从没出过让我抓狂的理解性问题,最多就是有时候模型能力确实不够,需要换个更强的上。而且MiniMax可以支持的充值金额精确到分,那会很喜欢拿这玩意儿处理微信余额剩余花不出去那种零头(笑)
当然,MiniMax还间接带我入了Claude Code的门。它的官方API文档推荐用Anthropic格式调用,顺带介绍了一个它资助的项目,叫cc-switch。我照着文档配完才发现,这玩意能让我在Claude Code里随便切模型。
从那之后就在不同的模型之间来回切,掉了就换,各家都吃一点比一比。
2月的时候第一次用上Step 3.5 Flash。官方送的额度多,价格奇低,水平还过得去,一下就统治了我CC用量的半壁江山。那之后试过各种中转站,FoxCode、RightCode废了换换了废,AIHubMix的CC分组倒是一直在用,上面有低价接入的国模御三家,cc-switch来回切。Step 3.5 Flash从首发版本一直用到后面跑不动了才换。
现在是GPT中转站的好时代(雾),超低价跑GPT-5.5,Harness也换到Codex去了。
写到这你可能会觉得,这人怎么这么能折腾,同一个问题用这么多个模型。
坦率的讲,我也想只用最好的那个。
但「最好的」跟「用得起的」之间有一道很现实的口子。我不是什么首富之子,API不能随便烧。Claude系列效果再怎么好我也用不起。。。我就一普通学生,预算有限,敢闯敢试,想做想玩。
那怎么办,要么等着有钱了再玩,要么把手头的资源用到极致。
我选了后者。
所以策略很简单,免费的薅,便宜的掏,贵的绕道。每个模型贴一个场景标签,这个做长对话,这个写代码,这个当甜点。需要什么场景就拉什么模型出来。
模型行业变化太快了。今天封神的明天可能就掉队,上周跑通的工作流这周就可能作废。绑定单一模型,才是最危险的事。
回头再看卡兹克那篇把AI使用者分成10个等级的文章,他提到Lv.7铸造师的一个标志是「精简工具栈、重构系统」。我之前觉得自己可能还没到那一步。但这么一梳理,我发现我其实已经在干这件事了,只不过我的工具栈里比他的多了一个维度,叫「预算」。
预算受限不是上限,是另一种约束条件下的创造力测试。卡兹克那个分级体系默认的是「只要你想,你就能」。但现实中,最好的模型不是你想用就能用的。在有限预算下还能跑到差不多的段位,我觉得比API敞开了用的人含金量高多了。
就像打游戏,别人一身橙装,你捡的都是蓝绿装,结果你们打到同一层。
当然,能蹭上好用的模型也是运气。这两年国产模型卷得厉害,DS免费又好用,Kimi舒服得像老朋友,MiniMax总能在关键时刻拉一把,Step 3.5 Flash用白菜价撑了我好几个月。甚至我试用StepClaw之后它每个月送我40r赠费,我哭死。
说真的,感谢这个时代。
不过话说回来,用得越多也有用得越多的问题。用GPT-5.4那段时间,我明显感觉自己思维方式都被同化成冰冷的结构化思维了,说话写东西不自觉往那个方向偏。
工具在塑造你,你也在筛选工具。这件事是双向的。
我现在手头这套阵容,说不上豪华,但够用。没有Claude全家桶,没有无限API额度。但DS、Kimi、GLM、MiniMax、GPT、Step各司其职,我知道什么场景该拉谁出来,我知道怎么用Harness让它们发挥最好的效果。
与其说我不需要最好的模型,不如说能把手里的资源用透彻用极限,什么模型都可以是最好的模型。
对了,最近ima更新copilot功能之后,我又开了个AI合伙人「爱总」(没错,就是开头这个AI合伙人)😘
以前我觉得,用AI最重要的是选对模型。
现在我觉得,最重要的是知道自己要什么,然后让模型来适配你,而不是反过来。
这就够了。
- 标题: 薯のAI模型之旅
- 作者: Potato
- 创建于 : 2026-05-26 20:45:23
- 更新于 : 2026-05-29 14:15:20
- 链接: https://hawaiipotato.github.io/随笔/shu-ai-model-journey/
- 版权声明: 本文章采用 CC BY 4.0 进行许可。