HBase 基本使用

[[HBase]] — Hadoop Database,是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的 Google 论文《Bigtable:一个结构化数据的分布式存储系统》。HBase 是 Google Bigtable 的开源实现,就像 Bigtable 利用了 Google 文件系统(File System)所提供的分布式数据存储一样,HBase 在 Hadoop 之上提供了类似于 Bigtable 的能力,利用 Hadoop HDFS 作为文件系统,利用 Hadoop MapReduce 来处理 HBase 中海量 Read more ...


获取在线视频的时长

这是清理记事本的文章,解决一个问题之后,将之前整理的内容,整理发布。清空 WizNote 计划。 问题 手上有一些视频链接的 URL,如何快速的得到这些视频的时长信息? 答案 经过一番调研,发现使用 ffprobe (和 ffmpeg 套件一起) 可以完美解决这个事情。将命令 -i 参数后面的地址改成线上URL 地址即可。 ffprobe -i https://cldup.com/po79gkocrO.mp4 -show_entries format=duration -v quiet -of csv="p=0" 也可以将此代码保存为 ge Read more ...

2017-02-11 ffmpeg , ffprobe

每天学习一个命令:perf 性能分析工具

Perf 全称Performance Event,是随着 Linux 2.6+ 一同发布的性能分析工具。通过它,应用程序可以利用 PMU,tracepoint 和内核中的特殊计数器来进行性能统计。它不但可以分析指定应用程序的性能问题 (per thread),也可以用来分析内核的性能问题,当然也可以同时分析应用代码和内核,从而全面理解应用程序中的性能瓶颈。 安装 perf 工具在 linux-tools 下面,安装如下三个包即可 apt-get install linux-tools-common linux-tools-generic linux- Read more ...

2017-02-02 linux , 监控 , 资源占用 , command , perf

Spark 学习笔记

Spark 是一个依托于 Hadoop 生态的分布式内存计算框架,在吸收了 Hadoop MapReduce 优点的基础上提出以 RDD 数据表示模型,将中间数据放到内存,用于迭代运算,适用于实时计算,交互式计算场景。 什么是 Spark 简单的讲是一个通用计算引擎。 A fast and general engine for large-scale data processing An open source implementation of Resilient Distributed Datasets (RDD) Support Read more ...

2017-01-28 spark , notes , hadoop

Kerberos 使用

Kerberos 是一个网络验证协议,通过使用密钥来为 client/server 应用提供高强度的安全校验。一个开源的实现是由 Massachusetts Institute of Technology 实现。Kerberos 也在很多商业产品中被使用。 Kerberos 使用 UDP,默认使用 88 端口 在 Hadoop 生态中涉及到的安全问题可以大致归纳为两类,Authentication 和 Authorization: Authentication 认证用户身份,也就是证明 A 是 A 的问题 Authorization 则是 Read more ...

2017-01-27 kerberos , security , protocol

Linux 下自动更新 Chrome

最近使用 Gmail 竟然告诉我“即将不支持此版本浏览器”,于是看了一样 Chrome 版本号 —- v52 , 感觉还很新啊,查了一下发现 Chrome 版本已经更新到了 v56。 但是 Linux 下 Chrome 不会自动更新, chrome://help/ 来查看也不会自动更新。所以搜索了一下,发现 Google 其实维护了自己的 Linux Repository。 因为我是通过网站下载 GUI 安装的,所以没有自动更新的模块,添加 Chrome 的 source 即可。 添加 PPA 源 如果使用 PPA,则可以通过下面的命令,让 apt Read more ...

2017-01-27 Linux , Chrome , Google , APT

每天学习一个命令:ln 创建链接

ln 它的功能是为某一个文件在另外一个位置建立一个同步的链接。当我们需要在不同的目录,用到相同的文件时,我们不需要在每一个需要的目录下都放一个必须相同的文件,我们只要在某个固定的目录,放上该文件,然后在 其它的目录下用 ln 命令链接(link)它就可以,不必重复的占用磁盘空间。非常类似于 Windows 系统中的快捷方式,但是又比超链接要强很多。 命令格式: ln [OPTION] TARGET LINK_NAME 命令功能: Linux 文件系统中,有所谓的链接 (link),我们可以将其视为档案的别名,而链接又可分为两种 : 硬链接 (h Read more ...

2017-01-26 linux , command , ln , link

每天学习一个命令: base64 编解码

Base64 是一种使用 64 个可打印的字符来表示二进制数据的方法,base64 中仅且包括字母 A-Za-z0-9+/ 共64个字符。Base64 通常处理文本数据,表示、传输、存储二进制数据。 Base64编码由来 有些网络传送渠道不支持所有字节,比如邮件发送,图像字节不可能全部都是可见字符,所以受到了很大限制。最好的解决办法就是在不改变传统协议的情况下,利用一种扩展方式来支持二进制文件的传送,把不可打印的字符用可打印字符来表示。 Base64 就是一种基于64个可打印字符来表示二进制数据的方法。 原理 Base64 索引中,64个字符使用 Read more ...

2017-01-20 base64 , linux , encode , decode

RESTful 接口

RESTful 为 Representational State Transfer 的缩写,拆分开这三个单词来就是: Representational - REST resources can be represented in virtually any form, include XML, JSON, or even HTML 表现层,资源的表现形式 State - concerned with the state of a resource 状态,指的是互联网上资源的状态 Transfer - transferring resour Read more ...

2017-01-10 Web , API , RESTful

每天学习一个命令:lscpu 查看 CPU 信息

lscpu 显示 CPU 的架构信息 lscpu 从 sysfs 和 proc/cpuinfo 中收集信息。这个命令的输出是规范的可以用来解析,或者给人来阅读。该命令显示的信息包括,CPU 的数量,线程 (thread),核心 (core),Socket 还有 Non-Uniform Memory Access (NUMA) 节点数。 Socket 具体是指的主板上 CPU 的插槽数量,一般笔记本只有一个,而服务器可能会有多个。如果有两个插槽,通常称为两路 Core 具体是指 CPU 的核心,也就是平常说的几核,比如八核之类 threa Read more ...

2017-01-09 linux , command

最近文章

  • 利用 mise 替换 asdf 的迁移方案
  • Field Theory CLI:把 X Bookmarks 同步到本地,变成可搜索的个人知识库
  • 在 OpenClaw 中配置 Longbridge CLI 与 Skill 打造对话式量化交易工作流 最近我一直在折腾自己的投资工作流,想把 AI Agent 和真实的行情、持仓、交易动作接到一起。手里一边是 [[Longbridge]] 账户,一边是 [[OpenClaw]] 这类可以扩展 Skill 的开源 Agent,单看都不缺能力,问题是它们原本不在一个工作界面里。查行情要切 App,下单要切网页,想做一点自动化分析还得自己补脚本。直到我把 Longbridge 官方的 longbridge-terminal 和 OpenClaw 里的 Longbridge Skill 接上,这套东西才终于顺了起来。现在我可以直接在终端里问 AI 一句话,让它去查报价、看持仓、整理数据,必要的时候再把下单命令准备好。这篇就把我自己跑通的过程和一些实际感受整理下来。
  • CLIProxyAPI 把 Claude Code、Gemini CLI、Codex 订阅包装成统一 API 的开源神器 最近在折腾自己的 AI 工具链时,我遇到了一个非常现实的痛点。手里同时握着 [[Claude]] Pro、ChatGPT Plus、Gemini Advanced 这几个订阅,每次想在自己的脚本或小工具里调用它们的能力,都只能望洋兴叹——订阅账号给的是网页端或 CLI 工具的使用权,而不是 API Key。如果想走 API 路径,就得额外付一次费,而且 API 的定价往往比订阅贵得多。于是我一直在找一个能把订阅账号的额度转化为 API 调用能力的方案,直到最近发现了 [[CLIProxyAPI]] 这个项目。今天就聊聊这个工具到底解决了什么问题。
  • LM Studio:在本地运行大语言模型的最佳桌面工具 自从各类大语言模型开始开源以来,我就一直在尝试在本地运行它们。早期折腾 [[llama.cpp]] 的时候,需要手动编译、手动下载模型权重、在命令行里敲参数,对于非技术背景的用户来说门槛相当高。直到我发现了 [[LM Studio]],才算是真正体验到了”把 AI 装进自己电脑”的顺畅感。用它运行本地模型,就像在 App Store 下载一个 App 一样自然。