OpenAI 的 Whisper 以及相关模型和项目

自动语音识别技术 (Automatic Speech Recognition,简称 ASR)最近得到了非常大的提升,这个技术允许计算机通过识别语音将其转录成文本,在日常生活中有着非常广泛的应用,比如各类语音助手,Siri,Google Now ,Alex 等等。 另外还有一项技术是通过文字生成语音(Text to Speech,简称 TTS),这一项技术在前两年听书的时候经常会用到,但是之前的语音合成的效果非常不好,但是这两年的发展越来越听不出来是机器了。 而现在要说的是 OpenAI 在语音识别技术上推出的 Whisper 模型,并且随着 Whisp Read more ...


信银国际大湾区双币信用卡开卡及使用

信银国际大湾区双币信用卡是中信香港(信银国际)发行的一张双币信用卡,专为经常往返大湾区的人士设计,支持人民币和港币签账。 9 月 11 号应用内申请,9 月 12 号拨打客服电话,获取了邮件,并提交身份材料到邮箱,9 月 15 号收到 CNCBI GBA DC CARD 申请获批的邮件,9 月 23 号 EMS 收到卡片。 权益 人民币签账高达 10%现金回赠及免外币签账手续费。 指定大湾区酒店以及高铁折扣 永安旅游 9% 的立减折扣。 高铁,满 200 HKD 享有 20 HKD 折扣。 指定商户消费立减 迎新礼遇 Read more ...


MemoAI 一款跨平台的语音视频转文字工具

MemoAI 是一款 AI 驱动的音频,视频转文字的工具,集成了高精度的语音识别技术,能够处理多语言的语音转文本,并且支持翻译成多语种字幕。 前两天介绍过一款 macOS 和 iOS 上的实时字幕生成的播放器 YPlayer,但是实际测试下来 YPlayer 虽然可以支持实时字幕,但是 YPlayer 并不能很好的支持字幕翻译,并且在一些小语种方面 YPlayer 识别准确率还有待提高,但是 MemoAI 可以通过加载更精确的模型,通过 AI 转写,提高识别的准确率以及通顺程度。 MemoAI 特别适合用于教育讲座,会议记录,媒体制作等领域。 Read more ...


关于懒猫微服的一点想法

这两天在 X 上看到一款非常有趣的产品「懒猫微服」,简单的了解了一下,定位是一款微型家用服务器。因为产品定位比较特殊,我也非常感兴趣,所以就做了一点点购买前的小小总结。顺便也给自己理一理思路,是否值得购买。 配置 Intel Core i5-1135G7 处理器,Intel 首款 AI 芯片,四核八线程,2.5GHz 主频,睿频 4.5GHz 西数 SN580 SSD 或三星 SSD 存储盘为东芝 2.5 寸机械硬盘 购买的理由 适合不折腾使用,打开安装,绑定账号即可使用,省去了自己安装系统,创建账号,然后还需要根据自己的需 Read more ...


开源的调查问卷 HeyForm

HeyForm 是一个开源表单,调查问卷生成器,允许任何人通过拖拽的方式设计调查问卷,测验等。无需任何编码技能,就可以快速生成一个美观的调查问卷。 HeyForm 是一个基于 JavaScript 开发的表单工具,提供了丰富的表单元素和模板,无需代码基础,只需要简单拖拽式操作,就可以轻松创建各种类型表单,比如调查问卷,订单收集,活动报名等等。 HeyForm 基于对话式的设计理念,将表单的每个问题都作为一个对话节点,我们可以根据自己的选择进行下一步操作,从而体验更加流畅的表单。 主要功能包括: 拖拽式表单设计界面,简单易用 丰富的表单元 Read more ...


YPlayer 一款支持本地生成字幕的播放器

YPlayer 是一款创新的视频播放器,专注于本地实时生成字幕,充分尊重用户的隐私。它不采集任何用户数据,也不会对外发送数据,确保用户的隐私安全。YPlayer 利用 macOS 的 Speech Recognition 和苹果的 CoreML 机器学习框架,实现了高效的语音识别和字幕生成功能。由于采用了 SwiftUI 的新特性,该播放器目前仅支持 macOS Big Sur (11.0) 及以上版本。 功能亮点 实时字幕生成:YPlayer 能够为每个视频本地实时生成字幕文件,支持多种语言,包括汉语(简体、繁体)、英语、日语、德语、意大利语 Read more ...


几大 AI 识图能力对比

今天在群里面看到有人分享了一张截图,好奇心使然让我想要知道这个应用是什么,因为分享的截图上面没有显示应用的名字,所以我就想到了使用现在的 AI,所以我依次尝试了 Claude,Gemini,ChatGPT,Perplexity 。 Claude Claude 的回答完全错误。 Gemini Gemini 完全不知道是什么。 ChatGPT 最终还是 ChatGPT,可以准确的识别这个应用的名字,我搜索确认确实是这个叫做 Endel 的应用。 Perplexity Pro Perplexity Pro 自动使用了 GPT-4 Read more ...


Yarn Workspaces 工作区

Yarn Workspaces 工作区是一种新的包管理方法,从 1.0 开始默认可用,它允许用户已工作区的方式只需要运行一次 yarn install 就可以安装所有的包。 Yarn Workspaces 是 Yarn 提供的 Monorepository 的管理机制,这使得我们可以在同一个代码库中管理多个项目,并且允许这些项目之间相互依赖,交叉引用。 为什么要有工作区的概念 如何使用 根目录下的 package.json { "private": true, "workspaces": ["workspace-a", "workspa Read more ...


Rust 编写的开源全文搜索引擎 Meilisearch

meilisearch 是一个使用 Rust 编写的全文搜索引擎,高性能,易用,可扩展。虽然之前使用过 [[Elasticsearch]],但是如果自己要维护一个分布式的实例还是挺困难的,正好在我的笔记里面之前有记录下来 meilisearch,Rust 编写,效率高,占用低,就正好学习总结一下。 有一个项目自己的服务器跑了好几年,抓取了超过一千万条下载信息,PostgreSQL 已经不堪重负,经常查询一条数据需要好几秒的时间,单纯的使用 SQL 查询已经完全满足不了需求,也就正好使用 meilisearch 重构一下。 功能 高性能:Mei Read more ...


一款无数据库在线笔记 Flatnotes

在我的 TODO List 里面很久之前记录了一下 Flatnotes,正好今天抽空整理了一下, Flatnotes 是一个开源的,自托管的、无数据库的笔记 Web 应用程序,Flatnotes 使用 Python 和 Vue 的技术栈,利用文件夹存储 Markdown 文件。它提供了一个简洁高效的平台,适合个人知识管理项目。 什么是 Flatnotes? Flatnotes 是一个轻量级的笔记应用,专为那些喜欢使用 Markdown 格式记录学习笔记、技术心得和读书感悟的用户设计。它的主要特点包括: 自托管:用户可以完全控制自己的数据,确 Read more ...


最近文章

  • 突破 Claude Code 5小时限制:利用 GitHub Copilot 代理 Claude Code 请求 如果大家高频使用 Claude Code 进行代码对话和生成工作的话, 经常会遇到 5 小时的限制。 幸运的是,如果你已经订阅了 GitHub Copilot,现在有一个巧妙的解决方案:通过本地代理将 GitHub Copilot 的 Claude Sonnet 4 模型转换为 Anthropic API 格式,从而绕过 Claude Code 的使用限制,继续享受顶级的 AI 编程体验。
  • Claude Code PM 开源项目: 给你的 Claude Code 配置一位 PM 在我使用使用 Claude Code 过程中,借鉴 Kiro,我逐渐习惯让 Claude Code 编写一个产品设计书放在 docs 文件夹下, 然后我会仔细地审查这一份产品设计文档, 修改其中的不明确的点, 或者是说 AI 理解错误的内容, 然后再让 Claude Code 通过这一个产品设计书来实现完整的代码。然而今天我看到的一个开源项目 Claude Code PM ,则是将我上面实现的这一套文档驱动的开发流程转变成了更专业的,更符合团队业务需求的流程,并且引入了敏捷开发,项目管理中的重要概念,及时是一个人的项目,通过 Claude Code PM 的流程约束,我发现 Claude Code 的智能程度也提升了不少。
  • Whispering 开源离线的语音转文字应用 在之前的视频和文章当中,我给大家介绍过非常多语音转文字的应用, 有订阅制的 [[Aqua Voice]] ,[[Wispr Flow]] ,[[Voicenotes]],[[VoiceInk]] ,[[superwhisper]] ,也有免费的 [[Spokenly]] ,在本地完全离线运行的 [[Tok]] 。 今天要为大家介绍的Whispering,正是这一领域的颠覆性产品——一个真正的开源、本地优先的语音转文字应用。
  • Crystal: 多 Claude Code 实例管理器 之前的视频当中介绍过了 Claudia,它是一个 Claude Code 的桌面管理器,它将很多 Claude Code 的终端功能迁移到了桌面版当中,它也支持在应用内直接和 Claude Code 进行对话,但是它缺少了一个核心的功能,那就是当我在同一个项目中开启不同的 Session 时,有可能产生冲突,为了避免这个问题,官方的解决办法是使用 Git worktree,在开发不同的功能时,使用不同的 Worktree 来隔离每一个 Cloud Code 的环境。 今天要介绍的 Crystal 就是这样的一款可以支持多个 Cloud Code 的桌面客户端,并且每一个会话之间相互隔离。
  • 解决 Claude Code 上下文丢失问题: claunch 项目会话管理 今天在使用 Claude Code 的过程,发生了一件非常沮丧的事情,我远程控制的 Claude Code 电脑忘记插上充电器,平时都是依靠连接的显示器进行充电的,昨天晚上将显示器关闭,导致使用的时候一直都是用的电脑的电池,于是在中午的时候,我通过 [[VibeTunnel]] 连接不上我的 Claude Code 了。并且 Claude Code 中执行的内容也中断了,最关键的是有一些上下文,如果重新再来,极有可能造成很大的不一致。

赞助