Field Theory CLI:把 X Bookmarks 同步到本地,变成可搜索的个人知识库

我一直觉得 [[X]] 的 Bookmark 是个很尴尬的功能。收藏的时候特别顺手,回头找的时候却基本靠运气。我的书签列表也是这样,技术帖子、产品发布、研究分享、各种零碎灵感全都混在一起,存得越多,越像一个只能往里扔东西的抽屉。最近我频繁在用 [[Claude Code]] 和 [[Codex]],于是对这件事更在意了:这些明明是我自己筛过一遍的信息,能不能别只躺在网页里,而是真正进到本地工作流里。 我看到 [[Field Theory CLI]] 的第一反应,就是这东西抓的点很准。它不是再造一个书签页面,也不是给收藏夹换一套花哨 UI,而是干脆把 X Read more ...


在 OpenClaw 中配置 Longbridge CLI 与 Skill 打造对话式量化交易工作流

最近我一直在折腾自己的投资工作流,想把 AI Agent 和真实的行情、持仓、交易动作接到一起。手里一边是 [[Longbridge]] 账户,一边是 [[OpenClaw]] 这类可以扩展 Skill 的开源 Agent,单看都不缺能力,问题是它们原本不在一个工作界面里。查行情要切 App,下单要切网页,想做一点自动化分析还得自己补脚本。直到我把 Longbridge 官方的 longbridge-terminal 和 OpenClaw 里的 Longbridge Skill 接上,这套东西才终于顺了起来。现在我可以直接在终端里问 AI 一句话,让它去 Read more ...


CLIProxyAPI 把 Claude Code、Gemini CLI、Codex 订阅包装成统一 API 的开源神器

最近在折腾自己的 AI 工具链时,我遇到了一个非常现实的痛点。手里同时握着 Claude Pro、ChatGPT Plus、Gemini Advanced 这几个订阅,每次想在自己的脚本或小工具里调用它们的能力,都只能望洋兴叹——订阅账号给的是网页端或 CLI 工具的使用权,而不是 API Key。如果想走 API 路径,就得额外付一次费,而且 API 的定价往往比订阅贵得多。于是我一直在找一个能把订阅账号的额度转化为 API 调用能力的方案,直到最近发现了 [[CLIProxyAPI]] 这个项目。今天就聊聊这个工具到底解决了什么问题。 CLIP Read more ...


LM Studio:在本地运行大语言模型的最佳桌面工具

自从各类大语言模型开始开源以来,我就一直在尝试在本地运行它们。早期折腾 [[llama.cpp]] 的时候,需要手动编译、手动下载模型权重、在命令行里敲参数,对于非技术背景的用户来说门槛相当高。直到我发现了 [[LM Studio]],才算是真正体验到了”把 AI 装进自己电脑”的顺畅感。用它运行本地模型,就像在 App Store 下载一个 App 一样自然。 什么是 LM Studio [[LM Studio]] 是一款免费的桌面应用,支持 macOS、Windows 和 Linux,专门用来在本地计算机上下载、管理和运行大语言模型。它底层基于 Read more ...

2026-04-05 lm-studio , llm , local-ai , gguf , ollama

Speakly:用声音代替键盘,AI 语音输入的新体验

这一年我试过不少语音转文字工具。最开始只是想少打一点字,后来发现问题没那么简单。真正拖慢我的,不只是键盘输入本身,而是在 [[Slack]]、邮件、[[Obsidian]]、浏览器输入框之间来回切换时,那种不断被打断的感觉。 [[Speakly]] 是最近让我比较愿意持续打开的一款。它不是我用过最完美的一个,但它确实有几个点做对了,所以我还是想单独记一笔。 语音输入为什么总差一口气 我现在越来越觉得,语音输入迟迟没有真正普及,问题不完全在识别率。主流模型把字听对,已经不算太难了。真正卡人的,是两件事。 一件是口语和书面语根本不是一回事。人讲话 Read more ...


Claude Code Agent Teams 是什么,如何使用

[[Anthropic]] 在 2026 年 2 月把 [[Claude Code]] Agent Teams 作为实验性能力推了出来。前两天我第一次写这篇文章的时候,更多还是从“概念上很酷”这个角度在理解它;但把官方那篇专门的 Agent Teams 文档完整看了一遍之后,我发现这个功能真正有意思的地方不只是“多个 Agent 并行”,而是它开始提供一套接近真实团队协作的运行机制:共享任务列表、队友之间直接通信、Lead 统一协调、以及在终端里把整个团队真正跑起来的显示模式。 这次我把文章重新补了一轮,尤其把之前略写带过的部分补实了:什么时候该用 Read more ...


语音活动检测 VAD 介绍

最近在整理一条语音处理链路的时候,我又一次被一个看起来不起眼,但实际上特别关键的模块提醒了:很多系统不是先输在大模型不够强,而是输在前面那一步根本没把“真正有人说话的片段”挑出来。麦克风一直开着,环境噪声不断,空白段一大堆,如果这些内容都一股脑喂给后面的 [[ASR]] 或语音理解模块,效果和成本都会一起变差。 这个前置模块就是 [[VAD]],全称是 Voice Activity Detection,中文通常翻成语音活动检测,或者更直白一点,叫“语音端点检测”也可以。它要解决的问题非常朴素:当前这段音频里,到底有没有人在说话。如果有,是从哪里开始,到 Read more ...


独角数卡用 Go 重写了:Dujiao-Next 全新架构的自动发卡系统

如果你做过数字商品的在线销售——卡密、激活码、会员订阅、虚拟服务之类的——大概率听说过[[独角数卡]](Dujiaoka)。这个基于 [[Laravel]] 框架的开源自动发卡系统在 GitHub 上积累了接近 12000 个 Star,是中文开源社区里最知名的发卡平台之一。我自己也用过一段时间,整体功能完整,但作为一个 PHP 项目,在部署和性能方面确实有一些让人头疼的地方。 最近发现原作者 assimon 做了一件大事——用 [[Go]] 语言从零重写了整个系统,推出了全新的 Dujiao-Next。从 2026 年 2 月创建仓库到现在,已经 Read more ...


轻量文件服务工具 dufs 介绍

我最近又开始折腾文件分享这件小事。 说它是小事,是因为需求其实很朴素:把一个目录临时共享出去,让手机、平板、另一台电脑能直接访问;或者给朋友、同事丢一批文件,顺手开个上传入口,把资料收回来。说它不小,是因为只要你认真找过一圈工具,就会发现这类需求特别容易落进两个极端。一个极端是太重,动不动就是数据库、用户系统、反向代理、对象存储、后台管理整套一起上;另一个极端是太轻,轻到只能下载静态文件,稍微多一点需求就卡住了。 也是在这种背景下,我重新注意到了 [[dufs]]。第一次知道它的时候,我只是把它当成一个“更好看一点的 python -m http.s Read more ...


AI Coding Agent 语境下的 Harness Engineering

最近这半年,我一直在深度使用各种 AI Coding Agent——从 [[Claude Code]] 到 [[OpenAI Codex]],从 [[Cursor]] 到 [[Windsurf]]。在这个过程中,我越来越强烈地感受到一件事:决定一个 AI 编程工具好不好用的,早已不是背后的大模型有多聪明,而是包裹在模型外面那一层「运行时系统」做得有多好。这层系统,业界现在有了一个越来越明确的名字——Harness。 Mitchell Hashimoto([[Terraform]] 的创始人)在他那篇广为流传的博客里,把自己使用 AI 编程的演进过程总结 Read more ...


最近文章

  • Surfingkeys:比 Vimium 更强大的浏览器键盘控制扩展 最早接触 [[Vimium]] 是在学习 Vim 编辑器之后,那种能用键盘完全控制浏览器的感觉确实让人着迷。不用频繁移手到鼠标,链接跳转、页面滚动、标签切换全用键盘搞定,效率提升的体验是实实在在的。用了几年 Vimium 之后,我开始接触到 [[Surfingkeys]],起初以为不过是另一个同类扩展,但深入用下来才发现这两者的差距远比我想象的大。
  • Denote 介绍 Emacs 下基于文件名的笔记系统 最近在 GitHub 上闲逛的时候,我发现了 [[李继刚]] 整理的一批 [[Claude Skills]],出于好奇就 clone 下来翻了翻仓库。打开目录一眼扫过去,几乎所有 Skill 输出的文档文件名都长得很特别,大致是这样的形式: 20260527162000==z--投资分析-ajinomoto-2802。这种带着长串数字时间戳、夹杂 == 和 – 分隔符的写法,一眼看上去既不像我熟悉的 [[Jekyll]] 那种 YYYY-MM-DD-title.md,也不像 [[Obsidian]] 里常见的中文标题直接做文件名,反而有种”工程化”过头的味道。
  • Ghostty 和 xterm-ghostty 是什么 最近我在 macOS 上重新整理终端工具链的时候,又一次认真看了 [[Ghostty]]。很多人第一次接触 Ghostty,会先被它的界面、速度或者作者背景吸引,但只要打开 Shell 跑一个 echo $TERM,很快就会看到一个更陌生的名字:xterm-ghostty。这个名字看起来像是传统 xterm 的变种,实际上它背后代表的是 Ghostty 对终端兼容性的一整套设计思路。很多人把它当成一个无关紧要的环境变量,但如果你经常使用 [[SSH]]、[[tmux]]、[[Vim]]、[[Neovim]]、[[less]] 或者各种 TUI 工具,理解 xterm-ghostty 会让你少踩很多坑。
  • 终端开发的新范式:从 Gemini CLI 到 Antigravity CLI 终端智能体的新旅程
  • Antigravity CLI:Google 推出的下一代终端 AI 编程智能体 最近在关注 Google I/O 2026 的动态时,看到了一个让我颇感兴趣的发布——[[Antigravity CLI]],Google 官方宣布用它来取代已经积累了超过 10 万 GitHub Stars 的 [[Gemini CLI]]。这个时机有点微妙:个人版 Gemini CLI 用户必须在 2026 年 6 月 18 日前完成迁移,否则将失去模型访问权限。作为一个长期在终端里工作、也在持续关注 AI 编程工具演进的开发者,我觉得有必要认真研究一下这个新工具到底带来了什么改变。