崔 锐
该用户没有分享资料
由崔 锐撰写的日志
Xapian的检索
8月8日
Xapian中有关查询的代码比索引复杂的多,因为它支持多种查询机制,而索引就只是循环叠加。如下面的多种查询机制:
- 概率性搜索排名
- 相关度反馈
- 词组和邻近搜索
- 全方位的布尔型搜索器
- 支持提取搜索关键字的词干
- 支持通配符查询
- 支持别名查询
- Xapian支持拼写纠正
xapian索引的term处理
7月31日
Xapian 是一个用C++编写的全文检索程序,License是GPL,它的作用类似于Java的lucene。Xapian 的 官方网站是http://xapian.org/,采用trac作为项目管理软件。如果想要了解更多则可以查看xapian的文档。Xapian的索引不支持中文切词,不管是单字切词还是多元切词,中文是同英文一样的处理方式。下面就来分析Xapian怎样索引英文文档。
rst2pdf图片处理(续)
7月26日
继在上一篇博客 《rst2pdf中图片的处理》 中提出问题,本文通过一个简单的实现,解决 rst 转换为 HTML 和 PDF 时图片显示不一致(尤其是PDF中不同格式图片忽大忽小)的问题。
图像分辨率是用于度量位图图像内数据量多少的一个参数。通常表示成ppi(每英寸像素 pixel per inch)和dpi(每英寸点 dot pre inch)。包含的数据越多,图形文件的长度就越大,也能表现更丰富的细节。但更大的文件也需要耗用更多的计算机资源,更多的内存,更大的硬盘空间等等。在另一方面,假如图像包含的数据不够充分(图形分辨率较低),就会显得相当粗糙,特别是把图像放大为一个较大尺寸观看的时候。Ppi和dpi经常都会出现混用现象。从技术角度说,”像素”(p)只存在于计算机显示领域,而”点”(d)只出现于打印或印刷领域。
rst2pdf中图片的处理
7月19日
一般情况下,使用reStructuredText(ReST) 生成PDF 格式的文件需要先转化成LaTeX 格式。而rst2pdf 通过调用reportlab 工具包直接生成PDF 文件。
Fail2ban—-暴力口令破解的克星
4月7日
Fail2ban对防止暴力破解口令有非常好的作用,它可以设置对方密码失败n次后用防火墙屏蔽n分钟,写入日志中,并可邮件你。 它的工作原理就是:
fail2ban → 监视log file → 连续出现多次错误信息 → 封锁IP.
Firebug—-javascript调试利器
3月26日
以前调试javascript 总是痛苦不堪的使用一个又一个的alert. 不过现在通过使用firefox 的firibug 的插件,终于摆脱了可恶的alert .
Nutch 深度的测试
3月19日
今天下午我做了一个Nutch深度的测试。先在apache2下建立一个小网站,这个网站用Git作版本控制工具,它只有5个网页,分别是a.html,b.html,c.html,d.html,index.html。它们的链接关系index.html中有a.html,a.html有b.html,依次类推。

最新评论