一种基于unicode和OCR的过审技巧

已知,字形相近但是大小、形状不完全相同的文字在unicode中的编码是不同的,但过审后人眼结合上下文很容易就能看出来要表达的是什么。

那么通过对敏感词中的字母文字进行替换,可以增加审查系统的工作量,即使最后过不了审,也可以极大消损审查系统所依附的硬件。

举几个常见的例子,
字母A,在拉丁字母、西里尔字母、希腊字母中,就有
ÀÁÂÃÄÅĀ这么多相近表示
那么党的英文party,就可以有
PĀRTY
PÅRTY
PÄRTY
等等表示

字母C有
Ç℃这么多近似的表示,就可以有
℃PC
ÇP℃
等表示

文字才有
日本假名ォ,就可以有
徐ォ厚这样的表示
0
分享 2026-02-22

7 个评论

有的输入法支持“火星文”,效果就类似。

不过其实也很好破,关键字对比是最简单的审查方式,无非是把
PĀRTY
PÅRTY
PÄRTY
徐ォ厚

全部加进过滤名单的事儿。
>> 有的输入法支持“火星文”,效果就类似。不过其实也很好破,关键字对比是最简单的审查方式,无非是把...


正则表达式:

徐[才ォ]厚
[pP][aÀÁÂÃÄÅĀ][rR][tT][yY]
>> 正则表达式:徐[才ォ]厚[pP][aÀÁÂÃÄÅĀ][rR][tT][yY]


反正很简单😋
>> 正则表达式:徐[才ォ]厚[pP][aÀÁÂÃÄÅĀ][rR][tT][yY]


第二行在ocr上已经太没效果了
wlw 观察

**该用户被封禁,内容已自动替换**

总结葱油讨论中的非对称抗争!我写了一份方法索引!

https://pincong.rocks/article/48753

1.1非对称抗争?

彭义士四通桥一役,惊天动地!
习近平非法连任,人神共愤!
然而,现实中,我们或受制于家有老小,或不能承受被训诫之后丢失工作,很难如彭义士般有如此义怒之举。
然而,并不是没有抗争方法了!抗争方法当然有,那就是非对称抗争!

1.2何为非对称抗争?

非对称抗争,旨在用最小的风险,来为共匪造成更大的麻烦。不去直接的举牌子拉条幅以卵击石,而是长期抗争,不停抗争,犹如“植物大战僵尸”中的“地刺”,悄悄地躺在地上,不停地刺击丧尸,积少成多!
非对称抗争,我大概分为两种:宣传上的抗争和物质上的抗争。这两种有重叠的部分。
宣传上,比如厕所革命等,书写标语反对共产主义的邪恶意识形态;
物质上,例如想办法把资金换成外汇转移,蚂蚁搬家但是积少成多!对共产党的金源展开特别经济行动!

1.3为何非对称抗争?

共产党的异议者很多。或为被铁拳锤后觉醒之人,或为被迫害的宗教与民族人士,当然也不乏支黑、加速党人。
有人会说,让中国人觉醒?不如加速。
其实,让更多的中国人觉醒,也是一种加速!加剧了共产党在意识形态领域的斗争,增加了其维稳经费!
所以,无论是华人异议者,还是所谓的“支黑”派,都应支持并进行非对称抗争!
>> 有的输入法支持“火星文”,效果就类似。不过其实也很好破,关键字对比是最简单的审查方式,无非是把...


没那么麻烦。在敏感词数据库加几行代码就行了,比如添加定义ォ=才,A= À= Ä= Å=……就是了
你可能需要这个表格
https://zhs.glyphwiki.org/wiki/Group:%E5%8E%9F%E8%A6%8F%E6%A0%BC%E5%88%86%E9%9B%A2

要发言请先登录注册

要发言请先登录注册

发起人

习禁评镜像版——习畅言

状态

  • 最新活动: 2026-02-23
  • 浏览: 1414