我一直觉得 [[X]] 的 Bookmark 是个很尴尬的功能。收藏的时候特别顺手,回头找的时候却基本靠运气。我的书签列表也是这样,技术帖子、产品发布、研究分享、各种零碎灵感全都混在一起,存得越多,越像一个只能往里扔东西的抽屉。最近我频繁在用 [[Claude Code]] 和 [[Codex]],于是对这件事更在意了:这些明明是我自己筛过一遍的信息,能不能别只躺在网页里,而是真正进到本地工作流里。
我看到 [[Field Theory CLI]] 的第一反应,就是这东西抓的点很准。它不是再造一个书签页面,也不是给收藏夹换一套花哨 UI,而是干脆把 X
Read more ...
最近我一直在折腾自己的投资工作流,想把 AI Agent 和真实的行情、持仓、交易动作接到一起。手里一边是 [[Longbridge]] 账户,一边是 [[OpenClaw]] 这类可以扩展 Skill 的开源 Agent,单看都不缺能力,问题是它们原本不在一个工作界面里。查行情要切 App,下单要切网页,想做一点自动化分析还得自己补脚本。直到我把 Longbridge 官方的 longbridge-terminal 和 OpenClaw 里的 Longbridge Skill 接上,这套东西才终于顺了起来。现在我可以直接在终端里问 AI 一句话,让它去
Read more ...
最近在折腾自己的 AI 工具链时,我遇到了一个非常现实的痛点。手里同时握着 Claude Pro、ChatGPT Plus、Gemini Advanced 这几个订阅,每次想在自己的脚本或小工具里调用它们的能力,都只能望洋兴叹——订阅账号给的是网页端或 CLI 工具的使用权,而不是 API Key。如果想走 API 路径,就得额外付一次费,而且 API 的定价往往比订阅贵得多。于是我一直在找一个能把订阅账号的额度转化为 API 调用能力的方案,直到最近发现了 [[CLIProxyAPI]] 这个项目。今天就聊聊这个工具到底解决了什么问题。
CLIP
Read more ...
自从各类大语言模型开始开源以来,我就一直在尝试在本地运行它们。早期折腾 [[llama.cpp]] 的时候,需要手动编译、手动下载模型权重、在命令行里敲参数,对于非技术背景的用户来说门槛相当高。直到我发现了 [[LM Studio]],才算是真正体验到了”把 AI 装进自己电脑”的顺畅感。用它运行本地模型,就像在 App Store 下载一个 App 一样自然。
什么是 LM Studio
[[LM Studio]] 是一款免费的桌面应用,支持 macOS、Windows 和 Linux,专门用来在本地计算机上下载、管理和运行大语言模型。它底层基于
Read more ...
这一年我试过不少语音转文字工具。最开始只是想少打一点字,后来发现问题没那么简单。真正拖慢我的,不只是键盘输入本身,而是在 [[Slack]]、邮件、[[Obsidian]]、浏览器输入框之间来回切换时,那种不断被打断的感觉。
[[Speakly]] 是最近让我比较愿意持续打开的一款。它不是我用过最完美的一个,但它确实有几个点做对了,所以我还是想单独记一笔。
语音输入为什么总差一口气
我现在越来越觉得,语音输入迟迟没有真正普及,问题不完全在识别率。主流模型把字听对,已经不算太难了。真正卡人的,是两件事。
一件是口语和书面语根本不是一回事。人讲话
Read more ...
[[Anthropic]] 在 2026 年 2 月把 [[Claude Code]] Agent Teams 作为实验性能力推了出来。前两天我第一次写这篇文章的时候,更多还是从“概念上很酷”这个角度在理解它;但把官方那篇专门的 Agent Teams 文档完整看了一遍之后,我发现这个功能真正有意思的地方不只是“多个 Agent 并行”,而是它开始提供一套接近真实团队协作的运行机制:共享任务列表、队友之间直接通信、Lead 统一协调、以及在终端里把整个团队真正跑起来的显示模式。
这次我把文章重新补了一轮,尤其把之前略写带过的部分补实了:什么时候该用
Read more ...
最近在整理一条语音处理链路的时候,我又一次被一个看起来不起眼,但实际上特别关键的模块提醒了:很多系统不是先输在大模型不够强,而是输在前面那一步根本没把“真正有人说话的片段”挑出来。麦克风一直开着,环境噪声不断,空白段一大堆,如果这些内容都一股脑喂给后面的 [[ASR]] 或语音理解模块,效果和成本都会一起变差。
这个前置模块就是 [[VAD]],全称是 Voice Activity Detection,中文通常翻成语音活动检测,或者更直白一点,叫“语音端点检测”也可以。它要解决的问题非常朴素:当前这段音频里,到底有没有人在说话。如果有,是从哪里开始,到
Read more ...
如果你做过数字商品的在线销售——卡密、激活码、会员订阅、虚拟服务之类的——大概率听说过[[独角数卡]](Dujiaoka)。这个基于 [[Laravel]] 框架的开源自动发卡系统在 GitHub 上积累了接近 12000 个 Star,是中文开源社区里最知名的发卡平台之一。我自己也用过一段时间,整体功能完整,但作为一个 PHP 项目,在部署和性能方面确实有一些让人头疼的地方。
最近发现原作者 assimon 做了一件大事——用 [[Go]] 语言从零重写了整个系统,推出了全新的 Dujiao-Next。从 2026 年 2 月创建仓库到现在,已经
Read more ...
我最近又开始折腾文件分享这件小事。
说它是小事,是因为需求其实很朴素:把一个目录临时共享出去,让手机、平板、另一台电脑能直接访问;或者给朋友、同事丢一批文件,顺手开个上传入口,把资料收回来。说它不小,是因为只要你认真找过一圈工具,就会发现这类需求特别容易落进两个极端。一个极端是太重,动不动就是数据库、用户系统、反向代理、对象存储、后台管理整套一起上;另一个极端是太轻,轻到只能下载静态文件,稍微多一点需求就卡住了。
也是在这种背景下,我重新注意到了 [[dufs]]。第一次知道它的时候,我只是把它当成一个“更好看一点的 python -m http.s
Read more ...
最近这半年,我一直在深度使用各种 AI Coding Agent——从 [[Claude Code]] 到 [[OpenAI Codex]],从 [[Cursor]] 到 [[Windsurf]]。在这个过程中,我越来越强烈地感受到一件事:决定一个 AI 编程工具好不好用的,早已不是背后的大模型有多聪明,而是包裹在模型外面那一层「运行时系统」做得有多好。这层系统,业界现在有了一个越来越明确的名字——Harness。
Mitchell Hashimoto([[Terraform]] 的创始人)在他那篇广为流传的博客里,把自己使用 AI 编程的演进过程总结
Read more ...