Instagram 的两种ID

Instagram 的 ID 生成策略是经过精心设计过的。1 每一秒 Instagram 都会收到无数用户上传的照片,在内部使用 [[PostgreSQL]] 分片存储到不同的服务器上。 这就产生了一个问题,要设计一个唯一 ID 生成方法用来标记系统中发布的每一张图片。 系统唯一 ID 需要满足如下条件: ID 应该是时间有序的,一组照片 ID 列表不再需要外部信息就可以排序(UUID 就不合适,因为完全无序) ID 最好是 64bit ,可以节省存储空间,索引也可以更小,也方便存储到 Redis 这样的系统中 系统应该尽可能少引入外 Read more ...

2017-11-13 id , instagram , decode , reverse

每天学习一个命令:iperf 测量带宽

iperf 命令是一个网络性能测试工具。iperf 可以测试 TCP 和 UDP 带宽质量。iperf 可以测量最大 TCP 带宽,具有多种参数和 UDP 特性。iperf 可以报告带宽,延迟抖动和数据包丢失。利用 iperf 这一特性,可以用来测试一些网络设备如路由器,防火墙,交换机等的性能。 iperf 在内存中运行,不会涉及到文件系统。iperf 存在非常多的版本,Windows,Linux,Android,iOS 都有对应的版本。可以到官网下载 安装 Linux 下安装: sudo apt-get install iperf 其他系统到 Read more ...

2017-11-11 linux , iperf , network , bandwidth

md5 散列

MD5 全称为 Message-Digest Algorithm ,一般用来保证信息传输的完整一致,MD5 的结果是固定长度 128bit 。MD5 算法最开始是为密码学而设计,但是后来被发现有很大的缺陷,所以后来就用来校验文件的完整性(无意识而造成的不完整,比如下载)。MD5 在非密码学领域也有其他用途,比如在一个数据库中快速检查一个 key 是否存在。 密码学的 hash 方法一个最基本的要求是,计算机难以通过计算来找到两个不同的内容拥有同一个 hash 值,MD5 无法满足该基本条件。MD5 算法无法防止碰撞,无法用于安全性验证,对于安全性高的资 Read more ...

2017-11-10 md5 , linux , 密码,

LevelDB 使用

nodejs wrapper: https://github.com/Level/levelup 源码: https://github.com/google/leveldb LevelDB 的原理 介绍 还有 这篇 LevelDB 的 C++ 接口 使用 LevelDB 在 iOS 下的 使用 Read more ...

2017-11-08 database , keyvalue , redis , google

分布式系统中唯一 ID 的生成方法

在分布式系统存在多个 Shard 的场景中, 同时在各个 Shard 插入数据时, 怎么给这些数据生成全局的 unique ID? 在单机系统中 (例如一个 MySQL 实例), unique ID 的生成是非常简单的, 直接利用 MySQL 自带的自增 ID 功能就可以实现. 但在一个存在多个 Shards 的分布式系统 (例如多个 MySQL 实例组成一个集群, 在这个集群中插入数据), 这个问题会变得复杂, 所生成的全局的 unique ID 要满足以下需求: 唯一性,保证生成的 ID 全局唯一 今后数据在多个 Shards 之间迁移 Read more ...

2017-11-08 java , 发号器 , id , auto-increase , mysql

flower 简单使用

Flower 是一个基于 Web 的监控和管理工具,可以用在 Celery 集群的监控和管理。和 Celery 配合使用非常不错。 Flower 可以查看 Celery 队列中 task 的数量,可以用来监控 worker 的状态并进行简单的管理,比如调整 worker 的 pool size 和 autoscale 设置,可以用来查看当前处理的 tasks, 等等。 安装 使用 pip 安装 Flower pip install flower 或者安装开发版 pip install https://github.com/mher/flowe Read more ...

2017-11-07 flower , monitor , linux , celery , django

每天学习一个命令:zip and unzip 压缩及解压缩

zip 是一个非常常见的压缩工具,很多平台包括 Unix, VMS, MSDOS, OS/2, Windows 9x/NT/XP, Minix, Atari, Macintosh, Amiga, and Acorn RISC OS 等都有应用。zip 结合了打包和压缩。 基本使用 参数非常多 zip options archive inpath infile zip [-aABcdDeEfFghjklLmoqrRSTuvVwXyz!@$] [--longoption ...] [-b path] [-n suffixes] [-t date] [- Read more ...

2017-11-06 linux , command , zip , tar , archive

一次 vim 的简单介绍

下面是一次 vim 的组内介绍的大纲。记录一下。 大纲 Vim 多模式编辑器 Normal mode Insert mode Visual mode Command mode 插入模式 i 进入 insert mode,在光标为之前进入插入模式 I 行首非空字符前插入 , I 等同于 `^i` s 删除光标下字符,并进入 insert mode, 等同于 `cl` S 删除光标所在一行,并进入 insert mode 行首 , 等同于 `^C` a 光标之后进入 insert mode A 光标移动到行尾并进入 insert mode , 等 Read more ...

2017-11-05 vim , linux , editor

在 Linux 下安装 Charles

Charles 是Mac上一款非常流行的抓包软件 , 但其实各大平台上 Charles 都有安装包。这篇文章主要就是讲一下在 Linux 平台上(Debian/Ubuntu) 系上安装 Charles 。 使用 APT 源安装 Charles 拥有 APT 源,首先安装 PGP 公钥,当前公开的秘钥为 1AD28806, 他的 fingerprint 为 4BA7 DB85 7B57 0089 7420 96E1 5F16 B97C 1AD2 8806: wget -q -O - https://www.charlesproxy.com/packa Read more ...

2017-11-04 linux , charles , http , mitmproxy , https , android , ios , tcp

Vim 中的寄存器

计算机中通常所说的寄存器 Register 一般指的是 CPU 中的寄存器,用来暂存 CPU 处理所需要的指令,数据等等。 Vim 中同样也有寄存器的概念,使用的方式和概念也和 CPU 是非常类似的。 Vim 的寄存器可以看成 Vim 中额外用来存储信息的区域,虽然看不见,但是如果使用 x, s, y, p 等等命令的时候都无意识的使用到了 Vim 的寄存器 (register). Vim 中每一个 register 都可以通过添加双引号的方式来访问,比如 "a 来访问 a 寄存器。 可以通过选择然后使用 y 来将内容放到寄存器中,比如 "ay 来 Read more ...

2017-11-03 vim , linux , editor , skill , vim-register

最近文章

  • 利用 macOS 的 LiveText 轻松复制视频文字实现观看韩综 前两天我录制了一期视频讲述如何通过 MemoAI 这样的语音转文字的应用来自动通过音频转写文字,然后变成字幕来观看韩综《思想验证区域:The community》,其实那一期视频主要是为了介绍软件应用的,所以就以我正在观看的韩综做了一个例子,但是其实制作字幕的时候我也知道,这一个综艺比较特殊,因为其中有很长的一段「讨论」,里面的参与者是通过匿名在线聊天室的方式录制的,所以整个综艺会有相当长的一段时间是没有人说话,而是大家都在打字进行辩论的!那么语音转文字就变得鸡肋了。所以这个地方字幕组也是非常辛苦,需要将视频中的字幕一个个取出来然后进行翻译叠加到视频里面。
  • MemoAI 一款跨平台的语音视频转文字工具 MemoAI 是一款 AI 驱动的音频,视频转文字的工具,集成了高精度的语音识别技术,能够处理多语言的语音转文本,并且支持翻译成多语种字幕。
  • YPlayer 一款支持本地生成字幕的播放器 YPlayer 是一款创新的视频播放器,专注于本地实时生成字幕,充分尊重用户的隐私。它不采集任何用户数据,也不会对外发送数据,确保用户的隐私安全。YPlayer 利用 macOS 的 Speech Recognition 和苹果的 CoreML 机器学习框架,实现了高效的语音识别和字幕生成功能。由于采用了 SwiftUI 的新特性,该播放器目前仅支持 macOS Big Sur (11.0) 及以上版本。
  • 几大 AI 识图能力对比 今天在群里面看到有人分享了一张截图,好奇心使然让我想要知道这个应用是什么,因为分享的截图上面没有显示应用的名字,所以我就想到了使用现在的 AI,所以我依次尝试了 Claude,Gemini,ChatGPT,Perplexity 。
  • Rust 编写的开源全文搜索引擎 Meilisearch meilisearch 是一个使用 Rust 编写的全文搜索引擎,高性能,易用,可扩展。虽然之前使用过 [[Elasticsearch]],但是如果自己要维护一个分布式的实例还是挺困难的,正好在我的笔记里面之前有记录下来 meilisearch,Rust 编写,效率高,占用低,就正好学习总结一下。