YPlayer 一款支持本地生成字幕的播放器

YPlayer 是一款创新的视频播放器,专注于本地实时生成字幕,充分尊重用户的隐私。它不采集任何用户数据,也不会对外发送数据,确保用户的隐私安全。YPlayer 利用 macOS 的 Speech Recognition 和苹果的 CoreML 机器学习框架,实现了高效的语音识别和字幕生成功能。由于采用了 SwiftUI 的新特性,该播放器目前仅支持 macOS Big Sur (11.0) 及以上版本。 功能亮点 实时字幕生成:YPlayer 能够为每个视频本地实时生成字幕文件,支持多种语言,包括汉语(简体、繁体)、英语、日语、德语、意大利语 Read more ...


几大 AI 识图能力对比

今天在群里面看到有人分享了一张截图,好奇心使然让我想要知道这个应用是什么,因为分享的截图上面没有显示应用的名字,所以我就想到了使用现在的 AI,所以我依次尝试了 Claude,Gemini,ChatGPT,Perplexity 。 Claude Claude 的回答完全错误。 Gemini Gemini 完全不知道是什么。 ChatGPT 最终还是 ChatGPT,可以准确的识别这个应用的名字,我搜索确认确实是这个叫做 Endel 的应用。 Perplexity Pro Perplexity Pro 自动使用了 GPT-4 Read more ...


Yarn Workspaces 工作区

Yarn Workspaces 工作区是一种新的包管理方法,从 1.0 开始默认可用,它允许用户已工作区的方式只需要运行一次 yarn install 就可以安装所有的包。 Yarn Workspaces 是 Yarn 提供的 Monorepository 的管理机制,这使得我们可以在同一个代码库中管理多个项目,并且允许这些项目之间相互依赖,交叉引用。 为什么要有工作区的概念 如何使用 根目录下的 package.json { "private": true, "workspaces": ["workspace-a", "workspa Read more ...


Rust 编写的开源全文搜索引擎 Meilisearch

meilisearch 是一个使用 Rust 编写的全文搜索引擎,高性能,易用,可扩展。虽然之前使用过 [[Elasticsearch]],但是如果自己要维护一个分布式的实例还是挺困难的,正好在我的笔记里面之前有记录下来 meilisearch,Rust 编写,效率高,占用低,就正好学习总结一下。 有一个项目自己的服务器跑了好几年,抓取了超过一千万条下载信息,PostgreSQL 已经不堪重负,经常查询一条数据需要好几秒的时间,单纯的使用 SQL 查询已经完全满足不了需求,也就正好使用 meilisearch 重构一下。 功能 高性能:Mei Read more ...


一款无数据库在线笔记 Flatnotes

在我的 TODO List 里面很久之前记录了一下 Flatnotes,正好今天抽空整理了一下, Flatnotes 是一个开源的,自托管的、无数据库的笔记 Web 应用程序,Flatnotes 使用 Python 和 Vue 的技术栈,利用文件夹存储 Markdown 文件。它提供了一个简洁高效的平台,适合个人知识管理项目。 什么是 Flatnotes? Flatnotes 是一个轻量级的笔记应用,专为那些喜欢使用 Markdown 格式记录学习笔记、技术心得和读书感悟的用户设计。它的主要特点包括: 自托管:用户可以完全控制自己的数据,确 Read more ...


FireCrawl 强大的数据爬虫工具

我之前的文章简单的介绍过Scrapy,pyspider 等等 Python 下的爬虫框架,但这些都是上古时期的爬虫工具,依赖于开发者手工解析 HTML,清洗页面中的数据,而在如今大部分网站都是动态渲染的时代,很多框架都已经落后,而今天想要介绍的这一款 FireCrawl 正是顺应了当今 AI 时代的潮流,成为了网络爬虫和数据提取的绝好工具。 FireCrawl FireCrawl 是 Mendable.ai 开发的一款开源的专业网络爬虫和数据提取工具,可以高效地抓取任何网页,并将其转化成结构化数据或者 Markdown 格式。在如今的 AI 时代,大 Read more ...


Telegram DOGS 提现

前两天在看到 Telegram 内部的一个小程序 Dogs,说是可以根据 Telegram 的注册时间账户年龄来获取响应的奖励。于是就点击查看了一下,但是实际上还是不太清楚是什么,现在就系统性的了解,并记录一下。 什么是 DOGS Dogs 是一个 Memo Coin 加密货币项目,通过用户的 Telegram 账户活动和注册时间来吸引用户来 Telegram 社区。DOGS 结合了流行文化和数字货币的元素。项目的主要货币是 DOGS 代币,它是一种 Memo Coin(模因币)。 这个 DOGS 的创意来自于 Telegram 的创始人 Pave Read more ...

2024-08-18 telegram , bybit , dogs , memo

Google Labs 出品的 NotebookLM:和你的文档对话

NotebookLM 是一款由谷歌开发的 AI 驱动的笔记应用和研究应用,可以帮助用户提高研究效率和快速获取文档信息。它能够处理多种格式的文档,如 Google Docs、PDF 和文本文件,粘贴板内容,网页地址,Markdown 文档,并提供智能摘要、创意生成和个性化 AI 助手功能。 在 OpenAI 开放 API 不久之后就出现过 ChatPDG 这样的项目,通过 OpenAI 的语言理解能力使得我们可以使用自然语言和 PDF 进行对话,而 NotebookLM 就是 Google 实验室给出来的大语言模型的一个具体的使用案例。 使用起来最舒服 Read more ...


意大利数字游民签证介绍及办理材料

前两天介绍过泰国的 DTV 数字游民签证,最近又看到了意大利的数字游民签证,所以来总结一下必须要的材料。 2024 年 4 月,意大利内政部在《官方公报》上正式发布数字游民法令。这一个法令实质上允许了高素质非欧盟远程工作者可以通过申请意大利数字游民工作签证,与家人一起在意大利定居,工作和学习。 目前,德国,挪威,冰岛等 15 个欧洲国家均已经推出了这一项政策。如今意大利也加快步伐赶上了。 意大利数字游民签证的优势 可以在意大利居住一年,可以选择续签,签证提供一年的停留期 可以带上家人,和其他数字游民签证不同 除去主要城市外,拥有较低 Read more ...


2024 年台北之行

去年的时候就得知了海外的大陆人可以通过官方网站申请入台证,从而可以在海外直接入境台湾,所以 4 月份女朋友过来日本之后就通过线上系统申请了入台证,入台证申请通过并付费之后是只有 3 个月有效期的,因为我们申请的比较晚,所以有效期的三个月正好落在了最热的 7,8,9 月份,但考虑到暑假有假期,我们还是决定硬着头皮买了机票。 行前准备 入台证,申请过程可以参考这篇文章 提前三天登录金福气,可以在落地之后进行抽奖,抽中之后可以获得 5000 新台币的奖励 下载应用 客路 Klook,美食,门票,新体验,可以使用我的邀请链 Read more ...


最近文章

  • Z-Image-Turbo 高性能 AI 图像生成模型 Z-Image-Turbo 是由阿里巴巴集团开发的高性能图像生成模型,基于 Z-Image 原始版本进行了深度蒸馏和强化学习。 这个模型采用了 6B 参数的轻量级设计,但能够在保证质量的前提下,实现闪电般的生成速度。
  • 小凹语音输入法 又一款语音转文字应用 在之前的文章中写过太多的语音转文字输入法,在 B 站的视频中也介绍了不少。包括 [[Aqua Voice]],[[Spokenly]],[[Wispr Flow]],[[superwhisper]], [[Whispering]] ,国内也有不少团队做出了类似 [[闪电说]],[[Ququ 蛐蛐]] 这样体验非常棒的应用。除了豆包语音输入法,现在又一家大语言模型公司下场做语音输入法,小凹语音输入法。
  • iPhone/iOS 利用 Whistle 代理抓包 之前的一篇文章当中介绍过 Whistle 这样一款非常强大的网络代理和抓包工具,我们可以轻松的利用 Whistle 实现系统级别的抓包。在之前的一篇视频当中,我介绍过如何在桌面版,比如说 macOS 和 windows 当中利用 Whistle。本文再来介绍一下如何在 iOS/iPhone 上利用 Whistle 进行抓包。
  • 语音转文字技术方案以及应用整理 在过去一年的博客当中,我介绍了不少和语音转文字相关的应用,有一些主打的是语音转文字的延迟低,有一些则以语音笔记为卖点,还有一些是语音输入法,我还介绍过很多开源项目,主打的是将视频内容转成文字。
  • Claude Code Skills 功能介绍以及使用经验 我们在使用 Claude Code 的过程当中,是否经常会遇到重复给 AI 提供相同的提示词,不停的告诉 Claude 我自己的工作方式和代码标准,虽然在之前我们可以通过 slash command 或者 CLAUDE.md 文件来部分实现。但今天我要介绍的 Claude Skill 可以更好的帮你解决这个问题。