在 ffmpeg package 中有一个 ffprobe 工具,主要用来查看多媒体文件或者流媒体信息,在线的视频信息也能够快速获取。大部分情况下个人比较喜欢使用 ffmpeg -i input.mp4
来快速查看,这种时候在终端上比较快速,而如果有些时候想要分析一下媒体文件,需要编程获取得到的媒体文件结果,显然 ffmpeg 的输出结果简直无法忍受,而 ffprobe 提供非常清晰的输出格式,非常方便的可以提供给编程软件解析使用。
官网说明:http://ffmpeg.org/ffprobe.html
ffprobe [OPTION] file
常用的参数
-show_format 显示输入多媒体流的容器格式信息
-show_streams 显示输入多媒体流中每一个流的信息
-i input_file 指定输入文件
-print_format json json 形式输出
-of 或者 -print_format default/compact/csv/flat/ini/json/xml
命令行:
./ffprobe -print_format json -show_format -show_streams -i ./video/c.ts
其中:
-print_format json 以 json 格式输出 ,
-show_format 输出封装格式信息 ,
-show_streams 输出流信息,
-i ./video/c.ts 输入文件
ffprobe -v error -show_format -show_streams input.mp4
输出该视频的基本信息,如果上面的命令输出结果过多,而只想要比如 size 可以
ffprobe -v error -show_entries format=size -of default=noprint_wrappers=1 input.mp4
如果只想要结果可以
ffprobe -v error -show_entries format=size -of default=noprint_wrappers=1:nokey=1 input.mp4
上面的命令中:
-v
参数是日志输出级别error
则略去了 build 和 generic 信息,暴露 error 错误-print_format
则是输出结果格式ffprobe -v error -show_entries format=duration -of default=noprint_wrappers=1:nokey=1 input.mp4
直接输出视频时长。
下面是一段 shell 脚本,之前遇到过有一批视频地址,想要获取这批视频的市场,用 ffprobe 就能够完成。
while IFS='' read -r line || [[ -n "$line" ]]; do
lineArray=($line)
echo ${lineArray[0]}
duration=$(ffprobe -i ${lineArray[1]} -show_entries format=duration -v quiet -of csv="p=0")
echo $duration
echo "${lineArray[0]} ${duration}" >> duration.txt
done < "$1"
ffprobe -show_streams -show_entries format=bit_rate,filename,start_time:stream=duration,width,height,display_aspect_ratio,r_frame_rate,bit_rate -of json -v quiet -i 98a74a06741a091b8a42aaa31b4edc66.mp4
输出:
{
"programs": [
],
"streams": [
{
"width": 720,
"height": 1280,
"display_aspect_ratio": "0:1",
"r_frame_rate": "30/1",
"duration": "40.833333",
"bit_rate": "1710937",
"disposition": {
"default": 1,
"dub": 0,
"original": 0,
"comment": 0,
"lyrics": 0,
"karaoke": 0,
"forced": 0,
"hearing_impaired": 0,
"visual_impaired": 0,
"clean_effects": 0,
"attached_pic": 0
},
"tags": {
"language": "und",
"handler_name": "VideoHandler"
}
},
{
"r_frame_rate": "0/0",
"duration": "40.890431",
"bit_rate": "128102",
"disposition": {
"default": 1,
"dub": 0,
"original": 0,
"comment": 0,
"lyrics": 0,
"karaoke": 0,
"forced": 0,
"hearing_impaired": 0,
"visual_impaired": 0,
"clean_effects": 0,
"attached_pic": 0
},
"tags": {
"language": "und",
"handler_name": "SoundHandler"
}
}
],
"format": {
"filename": "98a74a06741a091b8a42aaa31b4edc66.mp4",
"start_time": "-0.046440",
"bit_rate": "1065995"
}
}
mediainfo 也是一个用来获取音频视频信息的工具,比如封装格式、音视频编码格式、码率等信息。
mediainfo 可以获取的信息包括
mediainfo 支持的格式
mediainfo 输出的字段不容易被解析,表述方法不统一。例如,对于 h264 这种编码格式,mediainfo 可能输出的表述为 H.264 / AVC / MPEG-4 AVC / MPEG-4 part 10;还比如,对于 mp3 这样的音频格式,居然会分两个字段进行描述,分别说明 mpeg 和 layer3.
sed
全名叫 stream editor,是面向字符流的编辑器,能够完美地配合正则表达式使用。sed 提供的功能是交互式文本编辑器的延伸,提供的查找替换程序可以被全局应用于单个文件或多个文件。
面向字符流,是因为输入流通过程序并将输出直接输出到标准输出。
sed 处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用 sed 命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有改变,除非使用重定向存储输出。sed 主要用来自动编辑一个或多个文件;简化对文件的反复操作;编写转换程序等。
sed 功能:
awk
的典型示例是将数据转化为格式化报表。
awk 的起源追溯到 sed 和 grep,再往前追溯就到了 ed,最初的 UNIX 行编辑器。关于 ed 编辑器可以参考之前的 文章。
sed [-neifr] [ 命令 ]
选项与参数:
-n
:只有经过 sed 特殊处理的那一行(或者命令)才会被列出来。在一般 sed 的用法中,所有来自 STDIN 的数据一般都会被列出到终端上。-e
:直接在命令列模式上进行 sed 的命令编辑;-f
:从文件执行 sed 命令,-f filename
则可以运行 filename 内的 sed 命令;-r
:sed 默认支持正则表达式,使用 -r
开启扩展的正则表达式-i
:直接修改读取的文件内容,而不是输出到终端。命令说明: [n1[,n2]]command
n1, n2 :在 n1 到 n2 行之间使用命令,举例来说,如果我的命令是需要在 10 到 20 行之间进行的,则 10,20[ 命令行为 ]
command:
a :新增, a 的后面可以接字串,而这些字串会在新的一行出现(目前的下一行)~
c :取代, c 的后面可以接字串,这些字串可以取代 n1,n2 之间的行!
d :删除
i :插入, i 的后面可以接字串,而这些字串会在新的一行出现(目前的上一行);
p :列印,亦即将某个选择的数据印出。通常 p 会与参数 sed -n 一起运行~
s :替换,通常这个 s 的命令可以搭配正则 `1,20s/old/new/g`
注意如下的命令如果不清楚其含义的情况下,请谨慎执行!
下面的演示中会使用一个 nl
命令,这个命令会在打印文件内容的时候在前面增加行数显示。
仅列出 /etc/passwd
文件内的第 5-7 行
nl /etc/passwd | sed -n '5,7p'
5 lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
6 sync:x:5:0:sync:/sbin:/bin/sync
7 shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
这个 sed 的以行为单位的显示功能,就能够将某一个文件内的某些行号选择出来显示。
也可以直接使用
# 打印文件第3到5行
sed -n '3,5p' /path/to/file
以行为单位的新增 / 删除
将 /etc/passwd
的内容列出并且列印行号,同时,请将第 2~5 行删除,这里的删除是指在输出结果中删除,并不是真正去删除文件中的内容,如果要直接对文件进行修改,可以参考后文中的 -i
参数。
nl /etc/passwd | sed '2,5d'
1 root:x:0:0:root:/root:/bin/bash
6 sync:x:5:0:sync:/sbin:/bin/sync
7 shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
说明:
d
就是删除''
两个单引号括住只要删除第 2 行
nl /etc/passwd | sed '2d'
要删除第 3 到最后一行
nl /etc/passwd | sed '3,$d'
删除空白行
sed '/^$/d' file.txt
在第二行后(即是加在第三行)添加内容
nl /etc/passwd | sed '2a drink tea'
1 root:x:0:0:root:/root:/bin/bash
2 bin:x:1:1:bin:/bin:/sbin/nologin
drink tea
3 daemon:x:2:2:daemon:/sbin:/sbin/nologin
那如果是要在第二行前
nl /etc/passwd | sed '2i drink tea'
如果是要增加两行以上,在第二行后面加入两行字
nl /etc/passwd | sed '2a Drink tea or ......\
> drink beer ?'
1 root:x:0:0:root:/root:/bin/bash
2 bin:x:1:1:bin:/bin:/sbin/nologin
Drink tea or ......
drink beer ?
3 daemon:x:2:2:daemon:/sbin:/sbin/nologin
以行为单位的替换与显示
将第 2-5 行的内容替换为自己的内容
nl /etc/passwd | sed '2,5c No 2-5 number'
1 root:x:0:0:root:/root:/bin/bash
No 2-5 number
6 sync:x:5:0:sync:/sbin:/bin/sync
另外一个比较常见的场景是,在一个文件中针对特定的行需要在行尾增加一个字符。比如
192.168.1.1 host1
192.168.1.2 host2
192.168.1.3 host3
想要在 host2 后面增加字符 host25
变成 192.168.1.2 host2 host25
, 那就可以
sed '/192.168.1.2/s/$/ host25' path/to/file
验证无误之后可以直接使用 sed -i
原地替换。
搜索 /etc/passwd
有 root 关键字的行
nl /etc/passwd | sed '/root/p'
1 root:x:0:0:root:/root:/bin/bash
1 root:x:0:0:root:/root:/bin/bash
2 daemon:x:1:1:daemon:/usr/sbin:/bin/sh
3 bin:x:2:2:bin:/bin:/bin/sh
4 sys:x:3:3:sys:/dev:/bin/sh
5 sync:x:4:65534:sync:/bin:/bin/sync
如果 root 找到,除了输出所有行,还会输出匹配行。
使用-n
的时候将只打印包含正则的行。
nl /etc/passwd | sed -n '/root/p'
1 root:x:0:0:root:/root:/bin/bash
输出指定的行数 (输出 2-5 行的数据)
sed -n '2,5p' file
删除 /etc/passwd
所有包含 root 的行,其他行输出
nl /etc/passwd | sed '/root/d'
2 daemon:x:1:1:daemon:/usr/sbin:/bin/sh
3 bin:x:2:2:bin:/bin:/bin/sh
搜索 /etc/passwd
, 找到 root 对应的行,执行后面花括号中的一组命令,每个命令之间用分号分隔,这里把 bash 替换为 blueshell,再输出这行:
nl /etc/passwd | sed -n '/root/{s/bash/blueshell/;p}'
1 root:x:0:0:root:/root:/bin/blueshell
如果只替换 /etc/passwd 的第一个 bash 关键字为 blueshell,就退出
nl /etc/passwd | sed -n '/bash/{s/bash/blueshell/;p;q}'
1 root:x:0:0:root:/root:/bin/blueshell
最后的 q 是退出。
结尾的 g 表示匹配所有的
sed 's/regex/replace/g' file.txt
假如没有结尾的 g,比如
sed 's/book/books/' file.txt
则表示匹配一个 book,并替换为 books。
一条 sed 命令,删除 /etc/passwd
第三行到末尾的数据,并把 bash 替换为 blueshell
nl /etc/passwd | sed -e '3,$d' -e 's/bash/blueshell/'
1 root:x:0:0:root:/root:/bin/blueshell
2 daemon:x:1:1:daemon:/usr/sbin:/bin/sh
-e
表示多点编辑,第一个编辑命令删除 /etc/passwd 第三行到末尾的数据,第二条命令搜索 bash 替换为 blueshell。
sed 可以启用 -i
选项直接修改文件的内容,不必使用管道命令或者重定向。
sed -i 's/\.$/\!/g' filename.txt # 将文件每一行最后的 `.` 替换为 `!`
sed -i '$a # add to last' filename.txt # 每一行后面 ($) 增加 (a) 后面的内容
sed 可以直接修改文件内容,这样对于大文本,可以不需要使用 vim 打开在进行编辑,直接使用 sed 行读取编辑就能够实现行修改和替换的作用。
利用替换可以将不需要的内容替换成空
sed -n -e 's/^.*id=//p'
可以打印 id= 后面的内容,然后再做处理。
在 sed 的语法中,比如替换一行中的 Tab 到逗号,会发现
sed -i 's/\\t/,/g' some.txt
\t
其实并没有用,而是需要按下 Ctrl
+v
然后输入 Tab
才有效。
sed -i 's/ /,/g' some.txt
这样才有效。
vim-surrounding 插件可以轻松的一次性修改成对出现的,比如 ()
, []
, {}
, 双引号,XML 标签等等。提供了
包围内容的方法。
首先放上链接:
Plugin 'tpope/vim-surrounding'
用下面的例子做 demo
print("hello world")
光标定位在 hello world 包括引号,那么使用如下的命令可以实现双引号替换成单引号:
cs"'
Change surroundings is cs
. 接受两个参数,目标,和替换内容
cs"' # change " to '
cs"<q> # change " to <q>
cs)] # change ) to ]
如果要替换标签的内容,比如说将 h1 替换为 h2,则需要用到 t
<h1>Title</h1>
则需要 cst<h2>
,同理要将 <h1>
替换成双引号,则 cst"
假如有一行内容
<h1>This is a title</h1>
cs
还有一个变种 cS
,效果则是将变化的内容放到新行中。
给 hello 增加 <h2>
hello
那么可以使用 csw<h2>
,简单记忆成 change surrounding of word <h2>
,给 word 增加 <h2>
标记
可以看到 cs 接受两个参数,会用后一个参数替换前一个。
比如删除双引号,delete + surrounding + “
ds" # delete surrounding "
ds( # delete surrounding (
dst # delete surrounding tags
ds
和 cs
都将 target 作为第一个参数,所有的 target (text-objects) 目前都是一个字符。
(), [], {}, <>
b, r, B, a 分别对应上面括号
', ", `
t 表示 HTML 或者 XML 标签
w, W, s 分别是 word, WORD, sentence
p 表示 paragraph
给 hello 增加 <h2>
hello
使用更加复杂一点的 you surrounding inside word with <h2>
ysiw<h2>
ys
接受 vim motion 或者 text object 作为一个 object
如果要对整行操作可以使用 yss
后接修改的内容,比如给整行增加花括号
yssB
和 cS
一样,ys
也有变种版本 yS
和 ySS
,会在新行添加内容,比如给 paragraph 添加双引号
ySS"
在选择模式下可以使用 S
+ 需要添加的内容,来看快速对选择的内容增加 surroundings。
比如我想要给下面这一行中的一部分内容,比如说 main title 增加一个 <h1>
标记。
This is the main title sub title`
那么只需要将 This is the main title
使用 v
选中,然后按下 S<h1>Enter
回车之后前后就加上了 h1 标签。
在单行选择模式下, surroundings 会添加在行中,在 blockwise 选择模式,每一行都会 surround。
a = testa
b = testb
c = testc
加入上面的三行内容,想要给后面的内容增加双引号,那么可以使用列选选择然后 S + "
就可以快速添加。
Normal mode
-----------
ds - delete a surrounding
cs - change a surrounding
ys - add a surrounding
yS - add a surrounding and place the surrounded text on a new line + indent it
yss - add a surrounding to the whole line
ySs - add a surrounding to the whole line, place it on a new line + indent it
ySS - same as ySs
Visual mode
-----------
s - in visual mode, add a surrounding
S - in visual mode, add a surrounding but place text on new line + indent it
jhat 是 Java 的堆分析工具(Java heap Analyzes Tool),在 JDK 6u7 之后成为 JDK 标配。
jhat [options] heap-dump-file
说明:
-stack false|true
关闭对象分配调用栈跟踪 (tracking object allocation call stack)。 如果分配位置信息在堆转储中不可用,则必须将此标志设置为 false. 默认值为 true.
-refs false|true
关闭对象引用跟踪 (tracking of references to objects)。 默认值为 true. 默认情况下,返回的指针是指向其他特定对象的对象,如反向链接或输入引用 (referrers or incoming references), 会统计 / 计算堆中的所有对象。
-port port-number
设置 jhat HTTP server 的端口号。默认值 7000.
-exclude exclude-file
指定对象查询时需要排除的数据成员列表文件 (a file that lists data members that should be excluded from the reachable objects query)。 例如,如果文件列列出了 java.lang.String.value , 那么当从某个特定对象 Object o 计算可达的对象列表时,引用路径涉及 java.lang.String.value 的都会被排除。
-baseline exclude-file
指定一个基准堆转储 (baseline heap dump)。 在两个 heap dumps 中有相同 object ID 的对象会被标记为不是新的 (marked as not being new). 其他对象被标记为新的 (new). 在比较两个不同的堆转储时很有用。
-debug int
设置 debug 级别。0 表示不输出调试信息。 值越大则表示输出更详细的 debug 信息。
-J< flag >
因为 jhat 命令实际上会启动一个 JVM 来执行,通过 -J 可以在启动 JVM 时传入一些启动参数。例如,-J-Xmx512m
则指定运行 jhat 的 Java 虚拟机使用的最大堆内存为 512 MB. 如果需要使用多个 JVM 启动参数,则传入多个 -Jxxxxxx.
使用如下命令获取二进制堆转储文件
jmap -dump:format=b,file=heap-dump.hprof pid
然后使用
jhat -J-Xmx1024m heap-dump.hprof
来查看和分析堆信息,然后访问本地 7000 端口即可。
jhat 中可以使用 OQL(对象查询语言)来查询,这个 OQL 也是非常庞大,如果要展开说就很多了,这里举一个例子,比如要查找字符串对象中,保存了长度大于 100 的字符串可以使用
select s from java.lang.String s where s.count > 100
关于 OQL 更多的使用方法可以网上查询。
jdk 自带的命令用来 dump heap info,或者查看 ClassLoader info,等等。
jmap [OPTION] PID
直接使用命令
jmap pid
查看 pid 内存信息。
jmap -heap pid
统计对象 count ,live 表示在使用
jamp -histo pid
jmap -histo:live pid
jmap -clstats pid
jmap -dump:format=b,file=heapdump.phrof pid
hprof 二进制格式转储 Java 堆到指定 filename 的文件中,live 选项将堆中活动的对象转存。
执行的过程中为了保证 dump 的信息是可靠的,所以会暂停应用, 线上系统慎用
文件可以用 jhat 分析。
在运行 jmap 的时候可能遇到如下错误:
Attaching to process ID 18078, please wait...
Error attaching to process: sun.jvm.hotspot.runtime.VMVersionMismatchException: Supported versions are 25.131-b11. Target VM is 25.152-b38
sun.jvm.hotspot.debugger.DebuggerException: sun.jvm.hotspot.runtime.VMVersionMismatchException: Supported versions are 25.131-b11. Target VM is 25.152-b38
at sun.jvm.hotspot.HotSpotAgent.setupVM(HotSpotAgent.java:435)
at sun.jvm.hotspot.HotSpotAgent.go(HotSpotAgent.java:305)
at sun.jvm.hotspot.HotSpotAgent.attach(HotSpotAgent.java:140)
at sun.jvm.hotspot.tools.Tool.start(Tool.java:185)
at sun.jvm.hotspot.tools.Tool.execute(Tool.java:118)
at sun.jvm.hotspot.tools.PMap.main(PMap.java:72)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:498)
at sun.tools.jmap.JMap.runTool(JMap.java:201)
at sun.tools.jmap.JMap.main(JMap.java:130)
解决办法就是保证 jmap 的版本 也就是 JDK 的版本和运行的 JVM 的版本,也就是 JRE 的版本一致。
我使用 Java VisualVM GUI 来查看当前进程使用的 Java 版本,或者直接 ps 查看进程,然后再使用对应的 jmap 的版本。
要保证 jmap 运行的版本和运行的 java 进程程序使用同一个的 JRE(JDK) 的方法就是在 Linux 下使用
sudo update-alternatives --config java
来配置保证使用相同的 Java 程序。
使用 jmap dump 出来的二进制文件大小可能会有很大的差别。
在 MAT 中不会显示 unreachable objects。
可以在 Preferences -> Memory Analyzer -> Keep Unreachable Objects 来启用。
路由先断电,然后按住复位键或者 WPS 键开机,保持 10S 钟左右,然后用网线连接 LAN 口和电脑,打开浏览器进 192.168.1.1,就可以进入 U-boot 控制台,进去刷写固件
操作路径 :固件更新 -> 固件 -> 选择固件文件 -> 上传 -> 更新,刷完后机器会自动重启。
或者下载他人编译好的固件。
之前 也说过在 Openwrt 下使用迅雷远程下载,现在因为不想在 PC 端总是开着一个 shadowsocks 的程序,所以将 shadowsocks 安装到路由器端。然后还顺带解决一下 DNS 污染,和流量智能转发。
下载 编译好的 ipk
opkg update
opkg install libpolarssl
opkg install shadowsocks-libev_1.5.1_ar71xx.ipk
shadowsocks 安装后有三个命令,ss-local
启动 sock5 代理,ss-redir
启动透明代理,ss-tunnel
启动隧道。这里使用了 ss-local 和 ss-redir
# 编辑 vim /etc/shadowsocks.json
{
"server":"『服务器 ipv4/ipv6 地址』",
"server_port":8388, #服务器端口
"local_port":1081, #本地 sock5 代理端口
"password":"『密码』",
"timeout":300,
"method":"『加密方式』"
}
修改配置文件/etc/init.d/shadowsocks
START=95
SERVICE_USE_PID=1
SERVICE_WRITE_PID=1
SERVICE_DAEMONIZE=1
CONFIG=/etc/shadowsocks.json
start() {
service_start /usr/bin/ss-local -c $CONFIG
service_start /usr/bin/ss-redir -c $CONFIG
}
stop() {
service_stop /usr/bin/ss-local
service_stop /usr/bin/ss-redir
}
添加执行权限,设置开机启动
chmod +x /etc/init.d/shadowsocks
/etc/init.d/shadowsocks enable
opkg update
opkg install pdnsd
配置/etc/init.d/pdnsd.conf
global {
#debug = on;
perm_cache=1024;
cache_dir="/var/pdnsd";
run_as="nobody";
server_port = 1053; #使用 1053 作为 DNS 端口,默认是 53,一定要修改否则会跟默认 dnsmasq 冲突
server_ip = 127.0.0.1;
status_ctl = on;
query_method=tcp_only;#最重要的配置,只使用 tcp 查询上级 DNS
min_ttl=15m;
max_ttl=1w;
timeout=10;
}
server {
label= "googledns"; #这个 label 随便写
ip = 8.8.8.8; #这里为上级 dns 的 ip 地址,要求必须支持 TCP 查询,相关说明见后文注解
root_server = on;
uptest = none; #不去检测 dns 是否无效。
}
启用 pdnsd,并设置为开机启动:
/etc/init.d/pdnsd enable
/etc/init.d/pdnsd restart
完成!
openwrt 默认安装的 dnsmasq 不支持 ipset,需要先卸载,换成 dnsmasq-full,输入一下命令查看 dnsmasq 版本,写着 no ipset 的就需要安装完整版。
dnsmasq -v
运行以下命令:
opkg update
opkg install kmod-ipt-ipset ipset ipset-dns
opkg remove dnsmasq
opkg install dnsmasq-full
dnsmasq-full 从这里 下载,设置 dnsmasq 对特定域名使用本地的 pdnsd 进行解析:
为了保持配置文件整洁,建议在 /etc/dnsmasq.conf
最后加入:
conf-dir=/etc/dnsmasq.d
然后新建 mkdir 目录 /etc/dnsmasq.d
,在里面加入一个 conf,名字任选。譬如 /etc/dnsmasq.d/fuckgfw.conf
, 下面是我的文件内容,你可以按自己需要整理自己的:
#Google and Youtube
server=/.google.com/127.0.0.1#1053
server=/.google.com.hk/127.0.0.1#1053
server=/.gstatic.com/127.0.0.1#1053
server=/.ggpht.com/127.0.0.1#1053
server=/.googleusercontent.com/127.0.0.1#1053
server=/.appspot.com/127.0.0.1#1053
server=/.googlecode.com/127.0.0.1#1053
server=/.googleapis.com/127.0.0.1#1053
server=/.gmail.com/127.0.0.1#1053
server=/.google-analytics.com/127.0.0.1#1053
server=/.youtube.com/127.0.0.1#1053
server=/.googlevideo.com/127.0.0.1#1053
server=/.youtube-nocookie.com/127.0.0.1#1053
server=/.ytimg.com/127.0.0.1#1053
server=/.blogspot.com/127.0.0.1#1053
server=/.blogger.com/127.0.0.1#1053
#FaceBook
server=/.facebook.com/127.0.0.1#1053
server=/.thefacebook.com/127.0.0.1#1053
server=/.facebook.net/127.0.0.1#1053
server=/.fbcdn.net/127.0.0.1#1053
server=/.akamaihd.net/127.0.0.1#1053
#Twitter
server=/.twitter.com/127.0.0.1#1053
server=/.t.co/127.0.0.1#1053
server=/.bitly.com/127.0.0.1#1053
server=/.twimg.com/127.0.0.1#1053
server=/.tinypic.com/127.0.0.1#1053
server=/.yfrog.com/127.0.0.1#1053
#Google and Youtube
ipset=/.google.com/setmefree
ipset=/.google.com.hk/setmefree
ipset=/.gstatic.com/setmefree
ipset=/.ggpht.com/setmefree
ipset=/.googleusercontent.com/setmefree
ipset=/.appspot.com/setmefree
ipset=/.googlecode.com/setmefree
ipset=/.googleapis.com/setmefree
ipset=/.gmail.com/setmefree
ipset=/.google-analytics.com/setmefree
ipset=/.youtube.com/setmefree
ipset=/.googlevideo.com/setmefree
ipset=/.youtube-nocookie.com/setmefree
ipset=/.ytimg.com/setmefree
ipset=/.blogspot.com/setmefree
ipset=/.blogger.com/setmefree
#FaceBook
ipset=/.facebook.com/setmefree
ipset=/.thefacebook.com/setmefree
ipset=/.facebook.net/setmefree
ipset=/.fbcdn.net/setmefree
ipset=/.akamaihd.net/setmefree
#Twitter
ipset=/.twitter.com/setmefree
ipset=/.t.co/setmefree
ipset=/.bitly.com/setmefree
ipset=/.twimg.com/setmefree
ipset=/.tinypic.com/setmefree
ipset=/.yfrog.com/setmefree
#Dropbox
ipset=/.dropbox.com/setmefree
#1024
ipset=/.t66y.com/setmefree
#shadowsocks.org
ipset=/.shadowsocks.org/setmefree
#btdigg
ipset=/.btdigg.org/setmefree
#sf.net
ipset=/.sourceforge.net/setmefree
#feedly
ipset=/.feedly.com/setmefree
按照这种格式指定特定的域名走代理。
server=/google.com/127.0.0.1#1053
的含义是 google.com 通过本地 1053 端口解析地址
ipset=/google.com/setmefree
的含义给 google.com 的数据包打上标记,一会配置iptables
时会用到
接下来配置iptables
,在/etc/firewall.user
里加上两行
ipset -N setmefree iphash
iptables -t nat -A PREROUTING -p tcp -m set --match-set setmefree dst -j REDIRECT --to-port 1081
每条记录都需要跟一条 ipset 设置,不要忘了。作用是把打上了标记的数据包重定向到 ss-redir 的透明代理端口
root@OpenWrt:~# cd /usr/bin
touch shadowsocks-firewall
vi shadowsocks-firewall
修改文件内容
#!/bin/sh
#create a new chain named SHADOWSOCKS
iptables -t nat -N SHADOWSOCKS
# Ignore your shadowsocks server's addresses
# It's very IMPORTANT, just be careful.
iptables -t nat -A SHADOWSOCKS -d YOUR-SERVERS-IP-ADDRESS -j RETURN
# Ignore LANs IP address
iptables -t nat -A SHADOWSOCKS -d 0.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 10.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 127.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 169.254.0.0/16 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 172.16.0.0/12 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 192.168.0.0/16 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 224.0.0.0/4 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 240.0.0.0/4 -j RETURN
# Ignore Asia IP address
iptables -t nat -A SHADOWSOCKS -d 1.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 14.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 27.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 36.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 39.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 42.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 49.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 58.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 59.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 60.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 61.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 101.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 103.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 106.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 110.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 111.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 112.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 113.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 114.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 115.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 116.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 117.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 118.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 119.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 120.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 121.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 122.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 123.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 124.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 125.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 126.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 169.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 175.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 180.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 182.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 183.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 202.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 203.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 210.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 211.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 218.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 219.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 220.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 221.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 222.0.0.0/8 -j RETURN
iptables -t nat -A SHADOWSOCKS -d 223.0.0.0/8 -j RETURN
# Anything else should be redirected to shadowsocks's local port
iptables -t nat -A SHADOWSOCKS -p tcp -j REDIRECT --to-ports 1081
# Apply the rules
iptables -t nat -A PREROUTING -p tcp -j SHADOWSOCKS
解释 iptables -t nat -A SHADOWSOCKS -p tcp -j REDIRECT --to-ports 8024
这里的 8024 必须和 OpenWrt 路由器 /etc/shadowsocks.json
里的 local_port 一样,也就是说,如果 /etc/shadowsocks.json
里 "local_port":1081
, 那这里的 8024 也要改成 1081(如果照着我上面的本地端口填了 8080,这里就改成 8080)
配置成功后,chmod +x shadowsocks-firewall
给其运行权限。
运行
/usr/bin/shadowsocks-firewall
重启 dnsmasq 和 firewall 就可以实现流量自动分流了
/etc/init.d/dnsmasq restart
/etc/init.d/firewall restart
以后只要修改dnsmasq
的配置文件就可以指定更多的地址走代理
这里比较方便的是,通过 ChinaDNS 就可以了。
和安装 ShadowSocks 一样,可以先通过 WinSCP 上传到路由器。
opkg install ChinaDNS-C_1.0.0_ar71xx.ipk # 安装
/etc/init.d/chinadns start # 运行
/etc/init.d/chinadns enable # 开机启动
玩部落冲突(Clash of Clans)也已经四个多月了,这是我第一个花钱在上面的游戏,不过最近因为给别人看COC乱点花了我1200左右的钻石,顿时玩下去的信心都没有了,既然没有动力了,就来总结一下吧,就当是个结束。
很早知道这个游戏,看到很多人玩,包括很多身边的同学。但是机缘巧合有一好友也开始玩,就带着我一起开始玩了,于是从暑假开始,到今天11/5,差不多正好4个月时间,除了魔兽争霸这个游戏,还真没有一个游戏能让我坚持玩这么长时间的。什么吸引我呢?这个游戏依靠策略,攻打的策略,守家的策略,让人欲罢不能。另外就是好友及部落机制。再次就是不想偷菜种菜那么没有头脑,收集金币及圣水都是需要一定的技巧。虽然被人乱点坑了很多金币,并且不得不赞扬游戏公司对游戏参数的设置,让人无比的想花钱,并且会让人觉得花的很值得。
8本阵型
双菱形
##一些网站 YouTube Channal https://www.youtube.com/channel/UCxNMYToYIBPYV829BJcmUQg 这个频道从低等级开始,一步一步升级,单人模式,攻击策略,防御策略很全面,可以关注。
之前几个布阵的网站都是直接从Google点进去的,根本记不住网址,所以用Google喽搜喽。
##关于钻石 关于钻石,网上很多说免费的钻石的,千万别信,基本都是假的,稍微真的就是去赚礼品卡的钱,然后用礼品卡买钻石。游戏中成就和清理地面的灌木石块等等都能获取一定的钻石,所以省着点用很快能够买到第三个农民500钻,等第四个农民1000钻其实也应该很快,如果不出意外2000钻的第五个农民我马上也能有了,只是。。。。
最后有一点,我在升级过程中吃了很多苦头,就是千万不要着急升级大本营,COC匹配对手有一定的算法,当时也Google了,会根据一定的算法,等级越高越不好打,所以最好在每一个大本营造完全不建筑并且升级到最高等级不能升级再升大本营。
##一些技巧
参考:
推荐网站之求字体:通过图片找到对应字体。
最早遇到这个问题是我当时看陈墨评金庸系列书籍的时候封面上很漂亮的字体,下图中很大篇幅的小字。
当时我还没遇见这个求字体网站,我是直接在百度知道问的别人,正好还有人知道,当时就记住了这个字体—-超世纪粗行书。 今天看到别人在摄影上加上了很好看的Logo,不禁想知道中文的字体,于是找到了这个网站。使用体验都很好,因而推荐出来。
还有一个网站叫做 What The Font,也可以上传图片识别字体。
Rime IME 是中州韻輸入法引擎 (Rime Input Method Engine) 的缩写,项目网址如下:
按照官网给出的定义:Rime 不是一种输入法,是从各种常见键盘输入法中提炼出来的抽象的输入算法框架,这一套框架提供的灵活扩展性使得其不仅可以支持全拼,双拼等等中文输入,还可以扩展词库进行任何语言的输入,Rime 涵盖了大多数输入法的共性,所以在不同设定下,Rime 可化身为不同的输入法用来打字。Rime 是跨平台的输入法软件,Rime 输入方案可通用于以下发行版:
~/.config/fcitx/rime/
~/Library/Rime/
很多东西看官方的 wiki 就能看明白,希望在你继续看下去之前,先看完下面几个网址:
相信如果你看完了官方的文档,应该对 Rime 的安装和配置有了一定的了解,相信你在看得过程中也已经把 Rime 对应的版本安装上了,不同发行版的配置目录不同,通过 yaml
文件来配置,本文就在官方文档的基础上调整了一些配置来适应我的习惯。你不一定要完全按照我的配置来,不过我相信读完这篇文章,你一定能够随心配置出适合你自己输入习惯的 Rime。
下面的文章不是一篇入门的文章,你可能需要自行先阅读官网提供的 Wiki,以及自行安装上 Rime 体验一下之后,再阅读后面的内容。
关于安装本来不想多说什么,基本上都是非常简单的,但是在 Linux 上的一些使用经验告诉我,Linux 发行版上的 Rime,fcitx-rime 要比 ibus 版本的要好用,虽然官方建议的是 ibus 版本,但是我还是建议你使用一下 fcitx 版本的,并且结合 fcitx 的扩展会开启一个新的世界,比如自带粘贴版历史(Ctrl+;
),自带日韩语输入,这一切会让使用体验上升一个高度。
sudo apt install -y fcitx fcitx-rime
更多发行版见官网
在 macOS 上直接通过 Homebrew 安装:
brew cask install squirrel
或者从源码自行编译安装:
在初了解 Rime 的时候经常会被 Rime 中的几个输入方案的名字搞混,其实这三个方案 朙月拼音
,以及该方案的简体字版本,语句流版本都是同一个方案,不过在体验上略有差别,「语句流」风格的输入方案,在空格确认后,字词并不立即上屏,而是在输入句末的标点或者按下回车时整个句子才上屏。
安装完之后, fcitx-rime
的大部分的配置文件在 ~/.config/fcitx/rime
下,如果是 ibus
版本,将对应的 fcitx 替换成 ibus 即是配置地址,如果打开该目录能看到一系列默认配置:
default.yaml
: 全局配置weasel.yaml
: 发行版配置,比如 Windows 下就是 weasel, macOS 下面就是 squirrel.yaml
installation.yaml
: 安装信息,包括了输入法的前端发行版,版本,安装时间,安装的ID,rime 的版本,以及最重要的输入法数据备份路径等*.schema.yaml
: 各输入方案的配置文件,一般认为 schema 前的是输入方案的名字,一个输入方案可能对应多个字典user.yaml
: 用户状态用户自定义:
*.dict.yaml
: 用户字典*.custom.yaml
: 用户对 default.yaml
, *.schema.yaml
等配置文件进行修改的配置文件修改 Rime 配置文件并使之生效的方法很简单,保存文件,在 Rime 菜单中点击部署,就可以立即看到效果。Rime 建议使用 *.custom.yaml
的方式来自定义配置,因为 Rime 升级时会覆盖 Rime 自己的默认配置文件。
如果配置了同步目录,那么在同步目录能看到
*.userdb.txt
: Rime 会自动在一定时间后将用户的输入习惯生成快照文件,记录在 userdb.txt
文件中,分别记录了该输入方案下用户输入的历史纪录,备份级别:重要,具体文件内容解析可以参考后文UUID/
: 用户配置同步目录虽然现在很多手机上的输入法支持双语输入,但是桌面版的输入法除了搜狗,其他真的做的不行,但是 Rime 支持很多种双语切换时的处理方式。比如某些情况下一直在输入中文,但是中间要输入英文,通常的做法就是按下 Shift 来快速切换到英文模式,那么这个时候,如何处理已经输入的内容,Rime 提供了如下的配置:
inline_ascii
: 在输入法的临时英文编辑区内输入字母、数字、符号、空格等,回车上屏后自动复位到中文commit_text
: 已输入的候选文字上屏并切换至西文输入模式commit_code
: 已输入的编码字符上屏并切换至西文输入模式clear
: 丢弃已输入的内容并切换至西文输入模式noop
: 屏蔽该切换键具体设置如下:
ascii_composer:
good_old_caps_lock: true
switch_key:
Caps_Lock: noop
Eisu_toggle: clear
Shift_L: commit_code
Shift_R: commit_text
Control_L: commit_text
Control_R: noop
在这样的配置下,比如我已经输入了 vim
,但是输入法并没有 vim
的候选词,这个时候我按下左 Shift
,Rime 会按照配置,执行 commit_code
,也就是将输入的 vim
上屏,并切换到英文输入模式。这是我一直比较习惯的用法。
在设置自定义键的时候左右 Shift
和 fcitx
的快捷键有冲突。fcitx
设置中 额外的激活输入法快捷键
的 双侧 Shift
改掉或者禁用。
对于左 Shift
是将候选词上屏,Enter
则是将输入的内容原封不动上屏,和我之前的习惯保持一致。
要扩展 Rime 的词库,就必须要先知道 Rime 中词库的分类,Rime 中词库有两大类,一类是 *.dict.yaml
文件编译后生成的 *.table.bin
文件,这一类被称为固态词典,另一大类是用户输入习惯词典,一般保存在 *.userdb
文件夹中。固态词典不会随着用户的输入而发生变化,用户可以通过更改 dict.yaml 文件,然后重新部署生效,而用户词典则会随着用户的输入而发生变化,从而影响候选词的位置。用户词库会在同步时合并到 *.userdb.txt
文件中,并同步到配置的同步文件夹中,从而做到跨设备的同步。
Rime 自带的联想词库有其自身的局限,但是 Rime 可以支持扩展词典,在 Rime 配置目录下新建 *.dict.yaml
这样的文件:
luna_pinyin.mywords.dict.yaml
在文件中输入
# Rime dictionary
# encoding: utf-8
---
name: luna_pinyin.mywords
version: "2019.08.23"
sort: by_weight
use_preset_vocabulary: true
# 從 luna_pinyin.dict.yaml 導入包含單字的碼表
import_tables:
- luna_pinyin
...
# table begins
# 自定義的詞條
中州韵 zhong zhou yun 1
小狼毫 xiao lang hao
自动注音的词
这里需要注意的是 Rime 的码表,是 Tab 分割的三列,分别是文字、编码、使用频次,编码的定义以音节加空格分割。在制作自己的码表时一定要注意使用 Tab 分割。
编辑文件 luna_pinyin.custom.yaml
patch:
translator/dictionary: luna_pinyin.mywords
部署,就可以快速导入到 Rime 中。
部署之后尝试输入词库中任意一个比较复杂的词,理论上应该看到正确的词出现,否则可能词库未加载成功,那么需要到 /tmp/rime*
目录下查看 ERROR 日志。
关于如何制作自己的词库,后来我又写了一篇文章,可以参考这里。
在最开始的时候我最没有明白的一个配置就是 Rime 的同步机制,后来发现在 installation.yaml
文件中配置:
sync_dic: "/path/to/rsync"
installation_id: "mint-config"
然后点击 Rime 图标,部署,同步,这样用户配置和词库都会在配置的同步路径中。如果不修改 installation.yaml
配置,那么 Rime 默认会生成一个 UUID 的目录来存放同步文件
如果更换了电脑,将同步文件同步下来,然后配置 installation.yaml
,执行部署,同步,部署,然后配置、用户词库都可以了。
不同电脑之间的同步内容会以 installation_id
为名生成一个文件夹,文件的配置不会相互互通,但是用户字典是会同步的。
简单地来描述 Rime 的同步机制就是,不同电脑都会在同步目录中新建一个自己的 UUID 或者指定名字的目录,该目录下会保存所有自定义的修改,包括用户输入习惯的字典 *.userdb.txt
.
在点击同步时,Rime 会,会把同步目录中其他的 userdb.txt
合并:
sync/*/*.userdb.txt = 合并到 => 本地 *.userdb = 导出为 => sync/<installation_id>/*.userdb.txt`
其他电脑 = 複製來或從網盤同步下載 => sync/<installation_id>/ = 本地同步 => sync/<installation_id>/ = 複製走或同步上傳到網盤 => 其他电脑同步
也就不需要手动去合并字典,只需要在合适的时机同步一下目录即可。Rime 会自动处理 userdb.txt
的合并问题。
不过需要注意的是 Rime 虽然会将自定义配置及词库同步到目录,但这只是一个单向的同步,其他机器依然需要手动处理自定义配置及词库。
在同步后可以在同步目录观察到 *.userdb.txt
每一种输入方案都会对应一个这样的文件,其中保存的是用户的输入历史,打开文件看很容易可以猜测到每一行中的含义:
# Rime user dictionary
#@/db_name luna_pinyin.userdb
#@/db_type userdb
#@/rime_version 1.2.9
#@/tick 425369
#@/user_id mint-config
a 吖 c=14 d=4.71446e-09 t=425369
a 呵 c=1 d=6.28595e-10 t=425369
a 啊 c=8781 d=3.80755 t=425369
解释:
c
输入法 commit 的次数 1,这个数可能因为输入时删除掉前面的词而减少,或者如果用户手动 shift+delete
删除掉候选词也会 reset 成 0d
权重,结合时间,综合计算一个权重,随着时间推移,d 权重会衰减t
时间,记录该候选词最近一次的时间Rime 有一些默认设置,比如上下键选词,但是很少人打字的时候会把手移动到上下键去选词。
这里记录一下我自己的一些适配,用以调整我的习惯。
在修改 Rime 配置是,可以打开 Rime 的日志,对于我使用 fcitx-rime ,那么对应的日志在
/tmp/rime.fcitx-rime.*
一般有 ERROR,WARNING, INFO 三个文件。每一次部署时最好同时开着文件观察错误情况。
在 ~/.config/fcitx/rime
配置目录下,vi default.custom.yaml
patch:
schema_list:
- schema: luna_pinyin
- schema: luna_pinyin_simp
- schema: luna_pinyin_fluency
menu:
page_size: 6
自定义其中的 page_size
即可。
Rime 自带繁简切换,菜单中 (Ctrl+grave) 就可以设置。
Rime 自带
将 https://gist.github.com/2320943 作为模板保存到 luna_pinyin_simp.custom.yaml
、 luna_pinyin_tw.custom.yaml
或 luna_pinyin_fluency.custom.yaml
即可。
对于模糊音设置,官网有介绍 luna_pinyin 的实现方式
对于我,这条加上还是很有必要的
in
和 ing
参考链接
配置英文字典,自定义名叫 english 的 translator,然后把这个 translator 添加到数据方案中。
# 加載 easy_en 依賴
"schema/dependencies/@next": easy_en
# 載入翻譯英文的碼表翻譯器,取名爲 english
"engine/translators/@next": table_translator@english
# english 翻譯器的設定項
english:
dictionary: easy_en
spelling_hints: 9
enable_completion: true
enable_sentence: false
initial_quality: -3
注意这个时候需要 Rime 的配置目录中有 easy_en.dict.yaml
这个码表文件。
安装完 Rime 后,会安装 /usr/bin/rime_dict_manager
工具和 /usr/bin/rime_deployer
工具。
在运行这两个工具前需要关闭正在使用的 Rime 输入法,否则会占用需要的文件,而出现错误:
E0114 17:38:47.016017 9869 level_db.cc:291] Error opening db 'luna_pinyin.userdb' read-only.
管理工具,在 fcitx 的配置目录 ~/.config/fcitx/rime/
下运行
rime_dict_manager -l
会列出当前输入法配置方案。
导出词典
rime_dict_manager -e luna_pinyin export.txt
完整参数:
➜ /usr/bin/rime_dict_manager
options:
-l|--list
-s|--sync
-b|--backup dict_name
-r|--restore xxx.userdb.txt
-e|--export dict_name export.txt
-i|--import dict_name import.txt
看名字就知道 rime_deployer
是用来管理 Rime 部署相关操作的。
完整参数:
➜ /usr/bin/rime_deployer
options:
--build [dest_dir [shared_data_dir]]
--add-schema schema_id [...]
--set-active-schema schema_id
--compile x.schema.yaml [dest_dir [shared_data_dir]]
自动生成主题皮肤
material 质感的主题,很好看
fcitx 官方制作
Linux 终端配置 Rime 工具
OS X:
到这里,就会发现 Rime 已经能够满足日常的需求,我用全拼小鹤双拼,培养一段时间之后词库也很满足我的需求了。而到搜狗官网去看其介绍,细胞词库,云端输入,自动纠错,多彩皮肤,长词联想,网址输入,大部分的功能 Rime 都能做到,并且没有隐私问题,数据完全掌握在自己手里何乐而不为。
之前一直使用 Google 拼音输入法,Google 拼音输入法能够导出一套用户长期积累的词库。我利用“深蓝词库转换“工具将 Google 拼音输入法导出的词库,大概 7 万多条转成 Rime 词库格式。然后开始菜单调出,小狼毫用户词典管理,选中 luna_pinyin
,点击“导入文本码表”导入词库。瞬间就可以从 Google 拼音输入法转移到 Rime 输入法。导入文本码表只是针对 Google 拼音输入法中由用户积累的词汇。一般只建议将最为关键,带有词频信息的词库使用“导入文本码表”的方法导入到 Rime 输入法。
关于词库,Rime 输入法的词库有两部分组成。以下摘自贴吧:
佛振在设计用户词典时,没有考虑到有导入大词库的需求,就按照估计用戸可能积累起来的词彚量,把容量设置为「十万」规模以提升存储效率,超过这个量,性能则会下降。
佛振设计「【小狼毫】用戸词典管理」的初衷和真正目的,在於譲大家将自己従其他输入法中积累出来的用戸词彚,可以顺利地迁移到 rime 中。而不是譲你把其他输入法整个系统词库都搬进来。如今,「【小狼毫】用戸词典管理」这个功能和界面,已经被众多的小白同学稀里糊涂地滥用了。
如何正确的导入词库?
答:新增固态词典引用多份码表文件
过去一直没有简易的批量添加词汇做法,现在可以这样做:以【朙月拼音】为例,在输入方案裏指定一个新的词典名为
luna_pinyin.extended.dict.yaml
#luna_pinyin.custom.yaml
patch:
translator/dictionary: luna_pinyin.extended
然后在用户目录创建一个词典文件 luna_pinyin.extended.dict.yaml
#Rime dictionary
---
name: luna_pinyin.extended
version: "2013.04.22"
sort: by_weight
use_preset_vocabulary: true
import_tables:
- luna_pinyin
...
# table begins
鸹鸹! gua gua 100
这样一来,部署【朙月拼音】这个输入方案时,将编译 luna_pinyin.extended
这部词典,而这部词典除了导入【八股文】词汇表之外,还导入了名为 luna_pinyin
的词典文件,即 luna_pinyin.dict.yaml
。被导入的词典文件只取其码表,忽略 YAML 段。
被导入的码表与本词典自带的码表共同决定了编码集合。当然也可以:本文件的码表完全为空,只用来按需合并多个外部码表文件。
luna_pinyin.extended
这个词典的神奇之处是:虽然luna_pinyin.schema.yaml
已设置为加载名为 luna_pinyin.extended
的词典,但配套的用户词典名却是「luna_pinyin
」,即 Rime 自动取句点之前的部分为用户词典名,以保证按以上方法增补了词汇之后,不至於因为改变词典名而抛弃原有的用户词典。
请注意,此法的设计用途是合并编码方案相同的多份词典文件,而不是用来将不同的编码混在一起。
具体的示例代码可参考 https://gist.github.com/lotem/5443073
其中心思想提炼出来就是:
gist.github.com
上的示例中是 luna_pinyin.kunki.dict.yaml
),即给输入方案luna_pinyin
(明月拼音)打一个补靪,将调用的词库重置为luna_pinyin.kunki.dict.yaml
。luna_pinyin.kunki.dict.yaml
的文件,加入好你需要导入的词彚(如「瑾昀」等等)。并导入内置的系统词库(import_tables: luna_pinyin
)。其实佛振import_tables
的这个做法,頪似於 C 语言编程中的 #include
头文件。其目的和工作机制都是一様的。目的是引用头文件(或是系统预设词库)竝添加上自己的内容;工作机制是在编译(或是重新部署的时候),将链接到的不同的文本文件合并成一个文件,并処理成二进制文件。
我另外要在佛振同学的基础上补充几点
luna_pinyin.custom.yaml
和 luna_pinyin.extended.dict.yaml
都要放入用戸文件夹中import_tables
的方法,不仅仅可以导入预设的词典,甚至可以导入其他的自定义词典以笔者为例子,我在朙月拼音输入方案中设定的词库名叫 luna_pinyin.extended.dict.yaml
。
而我 luna_pinyin.extended.dict.yaml
在文件头部分,除了系统预设词库之外,还导入了其他的细胞词库
import_tables:
- luna_pinyin
- luna_pinyin.extra_hanzi
- luna_pinyin.sgmain
- luna_pinyin.chat
- luna_pinyin.net
- luna_pinyin.user
- luna_pinyin.cn_en
- luna_pinyin.website
- luna_pinyin.computer
- luna_pinyin.place
- luna_pinyin.shopping
- luna_pinyin.sougou
- luna_pinyin.kaomoji
- mywords
码表中的词彚格式
3.1 码表文件必须是 utf-8
无 bom 的编码。不能用 ansi,否则出来的词彚会乱码
3.2 Rime 对词彚的格式有着厳格的限定,其标凖形式是「词彚<tab>ci hui<tab>100
」(方引号内部的部分,<tab>
表示制表符(顕示为空白字符,不是空格))。
拼音码表的词彚格式是一个词彚占一行,不同的属性之间以制表符为间隔,编码之间以半角空格为间隔。従左往右依次是词彚、编码、词频。其中编码和词频是可省略的。也就是说
「词彚<tab>ci hui
」、「词彚<tab><tab>100
」、「词彚
」
都是合法词库文件格式。
如果词频省略,那麼输入法会优先调用「八股文」(一个预设的中文语言模型,包含词彚和词频两穜属性)的词频,如果八股文找不到该词彚的词频,那麼这个词彚的词频就当成 0 来処理。
如果编码省略,那麼输入法在重新部署,将文本码表生成固态词典的时候,会根据词库中的单字来给词彚自动编码(如果是拼音的话,叫「给词彚注音」更妥帖) 比如词库中有
我<tab>wo
和<tab>he
你<tab>ni
我和你
四个 item,那麼「我和你」这个省略了编码的词彚在生成固态词典的时候会自动被注音上「wo he ni」。其中有一个特别需要注意的地方,那就是処理多音字。对於含多音字的词彚,我们要侭量避免譲输入法给他自动注音,因为会帯来错误的读音(比如「重庆」读成「zhong qing」)所以一般含多音字的词彚都要最好标注上读音。如果实在没辧法弄到读音也没関系。因为 Rime 已经给多音字的罕见音做了降频処理。従而使得多音字的罕见音不会参与词彚的自动注音。
関於自动注音的具躰的细节可以看 rime 的 wiki,这裏我就不多说了。総而言之,我廃话那麼多,是为了譲大家了解 rime 词库的工作机制,其実就为了告诉大家两句话:「在导入词彚的时候,一般来说只要加纯汉字就够了。含多音字的词,系统词库一般都有,如果没有才要考虑给这个词注上音。」
另外,系统词库中,已经包含了完整的单字注音和罕用读音降频処理,大家可以放心地导入纯汉字词彚,不用太过担心。(所以一定给要记得import_tables: luna_pinyin
,来使自定义码表获得系统词库中的单字注音、含多音字词彚注音以及系统词彚词频)
关於楼主配置的多个词库挂接的方法实例,可参考由 rime-aca 友情提供的「朙月拼音·扩充词库」
下载地址:https://bintray.com/rime-aca/dictionaries/luna_pinyin.dict
参考:
# weasel.custom.yaml
patch:
"style/font_face": "华文行楷" # 字體名稱,從記事本等處的系統字體對話框裏能看到
"style/font_point": 16 # 字號,只認數字的,不認「五號」、「小五」這樣的
style/horizontal: true # 候選橫排
style/inline_preedit: true # 內嵌編碼(僅支持 TSF)
style/display_tray_icon: true # 顯示托盤圖標
Rime 最让我惊讶的是还支持一些常见的快捷键操作,通过配合这些快捷键可以在输入很长一段句子的时候提升体验。
ctrl+grave
(grave) tab 键上面,1 左边的那个键用来切换 Rime 输入方案shift+delete
删除选中的候选词,一般用来调整不希望在候选词前的词ctrl+ n/p
上下翻页选择候选词Ctrl+b/f
类似于左箭头,右箭头,可以快速调整输入,在输入很长一段后调整之前的输入时非常有效Ctrl+a/e
贯标快速跳转到句首或者句末Ctrl+d
删除光标后内容Ctrl+h
回退,删除光标前内容Ctrl+g
清空输入Ctrl+k
删词,等效于 Shift + delete(macOS 上可以使用 ⌘+k)-/+
或者 tab
来翻页更多的快捷键可以在 default.yaml
配置中看到。
遇到 Rime 在 Deploy 字典时
Encode failure:
的问题,这些字典中的字符可能存在问题。