狄云的所思所想

产品、技术想到哪写到哪

Skills邪修用法:帮你刷抖音并自动点赞好看的小哥哥/小姐姐

2026-01-28

为什么做这个

近几日AI新玩法越来越多,有点目不暇接,刚观摩完大佬们的Claude Skills自动生成PPT、自动剪视频等操作,马上又出来一个新工具,貌似Mac mini都要卖断货了~ 跟不上了,有点跟不上了。

今天得空,还是决定自己来玩一下Claude Skills,俗话说“纸上得来终觉浅”,自己写的最靠谱。

粗略翻了下Claude Skiils的文档,看了下相关介绍,有了点粗略印象,然后决定开始动手,最简单的办法当然是——把文档扔给AI,让AI读完文档再帮我实现啦!

这里简单介绍下Claude Skills,Claude Skills 就是给 Claude 装上的一个“专业技能包”或者说是一份“SOP”,有了这份技能说明,你就可以让大模型按照你给定的流程进行操作。除此之外,Claude Skills还能解决大模型们被塞爆的上下文窗口,因为Claude Skills采用的是“按需加载”的模式,不需要的东西不会加载进上下文。听起来似乎也很一般,实际上这是一个非常有用的工程实践。

具体不说了,可以去Claude官网查看相关文档,这里就开始我的操作。

稍微讲下过程

由于我一般都是使用Gemini Cli来进行编程等操作,Gemini不太知道后起之秀Claude Skills到底是什么,所以直接到官网将Skills的介绍复制下来,放到项目文件夹中,这里得夸一下Claude官方好用之处,值得国内所有云平台学习,它支持直接将markdown格式文档复制下来,方便发给AI们。
1.png

然后再问一下Gemini对于我想要通过Skills来刷抖音有什么思路没
2.png

挺有思路的,这里我选择了第二种方案,网页还是简单快捷很多。将初步方案整理整理,启动Gemini Cli,告知Skills相关文档路径,告知我准备做什么,当前用什么方案,然后Gemini自己就开始哼哧哼哧按照文档要求规划文件结构,编写SKILL.md文档以及需要用到的Python脚本。

然后是紧张又刺激的debug环节。可能很多人好奇是怎么debug的,其实没有什么高深的技巧,就是Gemini在写完所有文件后,要求它告知如何使用Skills,按照它给的步骤一步一步走,哪一步不行,就描述这一步无法进行,是什么场景下不行,以及页面上有什么反应,大白话一点就行(当然有编程基础能专业化描述更好),说完就让Gemini自己再去debug。

就这样你来我往几个回合,基本功能就可用了。
3.png

例如上图是初步效果,可以看到其实还有一点点小bug,返回了视觉模型分析失败,同样复制这段话,扔个Gemini问问为什么,他自己就分析出来是大模型返回的“max-tokens”返回值设定的过小,只有300,导致有些返回被截断了,json无法被正确解析,所以把“max-tokens”这个改大一点就好了。

稍微讲下原理

写完这个Skills的时候,我顺手就分享给别人观摩了,有人问我原理是啥,其实没啥特别了不起的。

Python的Playwright模块特别擅长自动化操作电脑浏览器,只需要使用Playwright,就能够很方便的登录并使用抖音网页。然后在刷抖音视频流时,随机截取一帧图像,发给另一个支持视觉识别的大模型,让它进行颜值评分,根据返回的颜值评分决定是否进行下一步点赞/关注。

多说一嘴,抖音网页版支持快捷键点赞和关注,这样脚本操作更简单了,只需要将快捷键告知AI即可。另外本来想试试新出的kimi-2.5模型视觉能力怎么样,结果用的英伟达开发平台免费的api,速度非常之慢,不知道是英伟达的问题还是kimi的问题,最后切换成谷歌家的gemini-3-flash-preview模型,速度非常快,效果也还行,非常推荐。

由于调试了许久,点赞了一堆小姐姐,现在我的抖音推荐流非常美丽(字面意义上的美丽)
4.jpg

这个Skills已在GitHub开源,感兴趣的小伙伴可以看看。目前功能比较简单,也是提供一个思路,大家可以在这个douyin-bot上添砖加瓦,实现自己想实现的自动化操作。

开源地址:
https://github.com/DemoJ/douyin-crush-bot

再多说一嘴

实际上这个不是非要Skills来实现,纯脚本,或者使用MCP等也是可以的,但是还是那句话,实践过后的东西才是自己的,所以这次也是纯整活,顺便分享一下思路。

当然实际上用Skills实现也有一个比较好的特点,对非编程人群比较友好,只要会用Skills,导入这个技能包就行了,剩下的环境、依赖啊啥的都可以全权委托给Claude Code了。