Google 发布的以图生图工具 Whisk

之前介绍过 Google 发布的在线笔记 NotebookLM ,也介绍过 Google 发布的知识学习 Learn About ,Google 虽然在 AI 上落后了 OpenAI 一节,但是内部的各个团队一直都在探索 AI 的不同能力。今天要介绍的就是 Google 刚推出的图片生成工具 Whisk,Whisk 和其他图片生成模型 [[DALL E3]]、 [[Stable Diffusion]] 、[[Midjourney]] 有所不同,抛弃了通过文字生成图片的模式,而是通过图片和图片组合,合成来生成新的图片。 Google Imagen 3 Read more ...


Trae 字节推出的一款本地 AI 代码编辑器

前两天看到字节也发布了一款基于 Claude Sonnet 3.5 的 IDE,起名叫做 Trae(这个名字是 The Real AI Engineer 的缩写),对标我之前介绍过的 Cursor,Windsurf 等等代码编辑器,都是以 AI 为切入点,辅助进行编码,不仅可以进行自动代码生成补全,还可以理解上下文,通过超长的 Context 提供多文件生成修改的能力。 字节在 AI 上的布局不仅包括了经常被提起的豆包(聊天助手,对标 ChatGPT 等),还扣子(对标 Coze,Dify 等),即创剪映等视频内容生成功能,而现在通过 Trae 补齐了 Read more ...


Tianji 开源的网站流量分析,服务监控系统

Tianji 是一个 All in One 的网站分析(Website analytics),服务监控(Uptime Monitor),业务告警(Server Status)的系统。 作者在项目动机中描述到,我们通常需要很多服务来监控一个网站的健康,比如我们可能需要使用访问分析工具,比如 [[Google Analytics]] 或者开源的 Umami 来统计我们网站每一个页面的 PV 和 UV,我们还需要一个 Uptime 监控来持续的检测服务器的网络质量和在线程度,我们可能还需要 Prometheus 这样的服务器来持续检测服务器的 CPU 使用率 Read more ...


体验 Fast Note Sync:打造私有且极致快速的 Obsidian 同步方案

最近这段时间,我一直在重新审视我的知识库管理流程,其中最让我头疼的依然是那个老生常谈的问题——多端同步。作为一个长期使用 Obsidian 的用户,我尝试过几乎所有主流的同步方案:最早是用 iCloud,但它在 Windows 端的表现简直可以用”灾难”来形容,经常出现文件卡死或者上传极慢的情况;后来我转向了 Git,配合 Working Copy 和 Obsidian Git 插件,这确实是一个非常极客且稳健的方案,版本控制让我很有安全感,但在移动端,尤其是当你只是想快速记录一个灵感时,等待 git pull 的那几秒钟甚至几十秒钟,往往就足以打断心流 Read more ...


Cline 强大的 AI 辅助编程工具

之前的文章中介绍过 AI 支持的编辑器 Cursor,还介绍过 Codium 推出的 AI 智能编辑器 Windsurf,很早之前也介绍过如何在 JetBrains IntelliJ IDEA 中使用 GitHub Copilot 以及如何在命令行终端下使用 GitHub Copilot CLI 可以在终端下完成一些 AI 智能补全,提示等等操作。 今天我要来介绍另外一款基于终端,以及 VS Code 的 AI 编程辅助工具 [[Cline]]。 Cline 是一款 AI 辅助编程的,借助 Cline 可以实现 AI 自主编码,可以创建编辑文件,执行 Read more ...

2025-01-10 ai , cli , sonnet , claude , vscode

使用 GitHub Actions 构建 Docker 镜像并上传到 GitHub Packages

本文介绍一下如何使用 GitHub Actions 构建 Docker 镜像,并上传到 GitHub Packages。 GitHub Actions GitHub Actions 是 GitHub 官方提供的一项自动化平台服务,主要用于自动化软件开发流程中的各类任务,尤其适合实现 CI/CD(持续集成与持续交付)。 详情可参考这一篇 GitHub Packages GitHub Packages 是 GitHub 提供的一项软件包托管与管理服务,支持开发者将各种类型的软件包(如依赖库、容器镜像等)与源代码一同集中管理。通过这一平台,开发者可以 Read more ...


Google Gemini 2.0 Flash Thinking 模型

今天要来介绍一下 Google Gemini 刚刚推出的一个推理模型 Gemini 2.0 Flash Thinking model,这个是 Gemini 版本的 GPT o1 模型,这个模型会首先思考一下,然后再回复。 这个 AI 模型基于最近发布的 Gemini 2.0 Flash 模型,设计上与 OpenAI o1 一类的推理模型非常类似。 但是和 OpenAI o1 不一样的是,Gemini 的模型思考的过程会直接直接展示出来,因为模型「思考」(推理)的过程本身就非常有趣,现在在 AI Studio 中可以直接使用,可以直接看到模型的推理过程 Read more ...


利用 PirateShip 打单节省美国转运费用

之前因为申请 [[ITIN]] 已经申请了一个 Anytime Mailbox 美国的私人地址,但是如果直接让 Anytime Mailbox 房东转寄邮件,价格非常昂贵,以我自己的经验只邮寄 0.1 磅不到的信件,房东报价就高达 70 美元。所以这篇文章我就总结一下如何与 Anytime Mailbox 的房东进行沟通并让房东使用我们自己提供的邮寄单,将我的物品从美国寄送回来。 但是如果相同的地址,相同的重量,在 Pirate Ship 中邮寄的话,只需要 27.12 美元,几乎只需要原价的 1/3 价格。 并且幸好我的 Anytime Mai Read more ...

2024-12-17 pirateship , ups , usps , anytime-mailbox , atmb , dhl

Mint Mobile 又一家美国移动网络运营商

在之前的一篇文章中,因为在 Mint Mobile 上的商城上购买了 299 美元 Pixel 9 手机,暂时了解到了 Mint Mobile 这家公司,这里再来详细地介绍一下这家公司。 Mint Mobile Mint Mobile 是一家成立于 2015 年的美国移动虚拟网络营运商(MVNO),总部位于加利福尼亚,科斯塔梅萨。作为一家虚拟营运商,Mint Mobile 不拥有自己的基础网络设施,而是租用 T-Mobile 的网络来为客户提供服务。 公司最初是 Ultra Mobile 的子公司,但是在 2019 年独立分拆,Mint Mobil Read more ...


299 USD 买了一台 Google Piexl 9

前些天黑五的时候就看到了 Pixel 优惠通知,299 美元可以购买一台 128GB Google Pixel 9,但当时没具体看,后来回来又看到一篇推送,然后查了一下 Pixel 的原价 799 感觉还是可以看看怎么购买的。 简单的了解了一下之后发现是从 Mint Mobile 官方的在线商城购买,只需要是 Mint Mobile 的新用户,直接登录 Mint Mobile 的账号之后就可以直接在页面进行下单。但是下单需要注意,只能运送到美国的地址,需要进行转运,但是我之前不是正好用 Amex 的信用卡领了两年的 MyUS 会员嘛,这里正好用上,还是 Read more ...


最近文章

  • Claude Code 第三方 API 代理配置 Headroom 最近在给自己的 AI 编程工作流加入 [[Headroom]] 上下文压缩工具时,遇到了一个需要特别注意的配置问题。相信有不少人和我一样,为了降低成本或者改善访问体验,已经在 [[Claude Code]] 或 [[Codex]] 里配置了第三方 API 代理,比如一些第三方聚合平台或者自建的转发服务。这时候想再套上一层 Headroom 做 Token 压缩,就需要特别注意配置细节,不然两层代理会打架。
  • Headroom:让 AI Agent 少花冤枉钱的上下文压缩工具 最近一段时间我在深度使用 [[Claude Code]] 做开发工作,用得越多,账单就越触目惊心。一次稍微复杂一点的任务,比如让它读取几个文件、搜索一下代码、跑一下测试,轻轻松松就能烧掉超过 100K 的 Token。更让人无奈的是,这 100K 里面有相当大一部分是重复冗余的内容——工具调用的输出、日志、搜索结果,它们被原封不动地塞进上下文,再一次次地发给模型,而模型其实只需要其中很小一部分关键信息。
  • 用 Harbor 搭建私有 Docker Registry:从安装到日常使用的完整实践 我维护过几个跑在自己服务器上的小项目,构建出来的 [[Docker]] 镜像最早都是直接推到 [[Docker Hub]] 上的。用了一段时间之后开始觉得别扭:一些只在内网跑的服务镜像,没必要也不应该传到公开的仓库;Docker Hub 对匿名拉取做了限流之后,CI 流水线偶尔会因为触发了速率限制而失败;再加上想给不同的项目、不同的同事分配不同的访问权限时,公共仓库这套体系根本满足不了。折腾到后来我意识到,是时候在自己的机器上搭一个真正能用的私有镜像仓库了。
  • 用 New API 打造个人 AI 网关:统一管理所有大语言模型接口 这段时间我同时用着好几个大语言模型服务:日常写作和代码靠 [[Claude]],轻量任务交给 [[Codex]],搜索增强用 [[Antigravity]],还有几个本地跑着 [[Ollama]] 的小模型供离线场景使用。每个平台各自的 API Key 散落在项目环境变量里,月底要去好几个后台分别对账,想横向对比两个模型的输出还得打开不同的网页或客户端来回切换,很费事。
  • Surfingkeys:比 Vimium 更强大的浏览器键盘控制扩展 最早接触 [[Vimium]] 是在学习 Vim 编辑器之后,那种能用键盘完全控制浏览器的感觉确实让人着迷。不用频繁移手到鼠标,链接跳转、页面滚动、标签切换全用键盘搞定,效率提升的体验是实实在在的。用了几年 Vimium 之后,我开始接触到 [[Surfingkeys]],起初以为不过是另一个同类扩展,但深入用下来才发现这两者的差距远比我想象的大。