<?xml version="1.0" encoding="UTF-8"?> <rss
version="2.0"
xmlns:content="http://purl.org/rss/1.0/modules/content/"
xmlns:wfw="http://wellformedweb.org/CommentAPI/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:atom="http://www.w3.org/2005/Atom"
xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
><channel><title>群英汇博客 &#187; Java＆J2EE</title> <atom:link href="http://blog.ossxp.com/category/%e6%8a%80%e6%9c%af%e6%96%87%e7%ab%a0/java%ef%bc%86j2ee/feed/" rel="self" type="application/rss+xml" /><link>http://blog.ossxp.com</link> <description></description> <lastBuildDate>Wed, 14 Sep 2011 03:52:03 +0000</lastBuildDate> <generator>http://wordpress.org/?v=2.9.2</generator> <language>en</language> <sy:updatePeriod>hourly</sy:updatePeriod> <sy:updateFrequency>1</sy:updateFrequency> <item><title>Nutch的安装与配置</title><link>http://blog.ossxp.com/2010/03/746/</link> <comments>http://blog.ossxp.com/2010/03/746/#comments</comments> <pubDate>Fri, 05 Mar 2010 09:38:54 +0000</pubDate> <dc:creator>崔 锐</dc:creator> <category><![CDATA[Java＆J2EE]]></category> <category><![CDATA[搜索引擎]]></category> <category><![CDATA[nutch]]></category> <category><![CDATA[搜索引擎，java]]></category><guid
isPermaLink="false">http://blog.ossxp.com/?p=746</guid> <description><![CDATA[Nutch的介绍
Nutch是一个开源Java实现的 搜索引擎 。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫.Nutch的安装
在Apache官方网页下载目前最新版本的 Nutch-1.0 ,大小83M。解压下载的压缩包:
$ tar -zxvf nutch-1.0.tar.gz环境变量的配置
确保已安装jdk和tomcat,设置环境变量NUTCH_JAVA_HOME:
$ export NUTCH_JAVA_HOME=$JAVA_HOME抓取前的配置工作新建myurl文本文件，文件中写入要抓取网站的顶级网址，即要抓取的起始页。以我抓取我们公司的博客网站为例： http://blog.ossxp.com/编辑conf/crawl-urlfilter.txt文件，修改MY.DOMAIN.NAME部分，把它替换为你想要抓取的域名（地       址），即把:
# accept hosts in MY.DOMAIN.NAME
+^http://([a-z0-9]*\.)*MY.DOMAIN.NAME/
修改为：
# accept hosts in MY.DOMAIN.NAME
+^http://([a-z0-9]*\.)*ossxp.com/编辑conf/nutch-site.xml文件，在&#60;configuration&#62;&#60;/configuration&#62;中加入下面一段:
&#60;configuration&#62;
&#60;property&#62;
&#60;name&#62;http.agent.name&#60;/name&#62;
&#60;value&#62;HD nutch agent&#60;/value&#62;
&#60;/property&#62;
<a
href="http://blog.ossxp.com/2010/03/746/" class="more-link">阅读全部内容 &#187;</a>]]></description> <wfw:commentRss>http://blog.ossxp.com/2010/03/746/feed/</wfw:commentRss> <slash:comments>1</slash:comments> </item> <item><title>用过滤器解决getRemoteUser()为的null的问题</title><link>http://blog.ossxp.com/2010/02/474/</link> <comments>http://blog.ossxp.com/2010/02/474/#comments</comments> <pubDate>Thu, 04 Feb 2010 11:47:56 +0000</pubDate> <dc:creator>崔 锐</dc:creator> <category><![CDATA[Java＆J2EE]]></category> <category><![CDATA[技术文章]]></category> <category><![CDATA[未分类]]></category> <category><![CDATA[Apache]]></category> <category><![CDATA[mod_jk]]></category> <category><![CDATA[REMOTE_USER]]></category> <category><![CDATA[Tomcat]]></category><guid
isPermaLink="false">http://blog.ossxp.com/?p=474</guid> <description><![CDATA[
上次在 解决getRemoteUser()为null的问题中提到从index.jsp中得到&#60;%= request.getRemoteUser() %&#62;。昨天，同事给我提议使用过滤器，于是我在上次的基础上做了修改。过滤器是请求和响应之间的一种WEB组件，它驻留在服务器端，用来截取客户端与资源之间的请求，并对这些信息进行“过滤”。我从filter中使用request.getRemoteUser(),然后使用request.getSession().setAttribute(&#8220;key&#8221;,value)保存在session中，下面是我使用的代码:
public void doFilter(ServletRequest req, ServletResponse rep,
FilterChain chain) throws IOException, ServletException {
HttpServletRequest request = (HttpServletRequest) req;
HttpServletResponse reponse = (HttpServletResponse) rep;
<a
href="http://blog.ossxp.com/2010/02/474/" class="more-link">阅读全部内容 &#187;</a>]]></description> <wfw:commentRss>http://blog.ossxp.com/2010/02/474/feed/</wfw:commentRss> <slash:comments>0</slash:comments> </item> <item><title>解决getRemoteUser()为null的问题</title><link>http://blog.ossxp.com/2010/02/454/</link> <comments>http://blog.ossxp.com/2010/02/454/#comments</comments> <pubDate>Tue, 02 Feb 2010 12:37:25 +0000</pubDate> <dc:creator>崔 锐</dc:creator> <category><![CDATA[Java＆J2EE]]></category> <category><![CDATA[技术文章]]></category> <category><![CDATA[Apache]]></category> <category><![CDATA[mod_jk]]></category> <category><![CDATA[REMOTE_USER]]></category> <category><![CDATA[Tomcat]]></category><guid
isPermaLink="false">http://blog.ossxp.com/?p=454</guid> <description><![CDATA[
最近的项目需要Apache2+tomcat6配置Basic认证，项目后台需要得到Basic认证的用户名，但是始终request.getRemoteUser()=null。这几天通过查看 mod_jk文档 和在同事的帮助下，终于使得index.jsp页面上&#60;%= request.getRemoteUser() %&#62;不再为null。
主要过程
下面我把使用的主要配置说明一下.首先，在${TOMCAT_HOME}/conf /server.xml里面,找到AJP13对应的那个 connector节点,添加tomcatAuthentication=&#8221;false&#8221; ,这个属性默认是True,意思是使用Tomcat本身的认证,不使用外部Server传进来的认证信息。
然后，在apache的httpd.conf配置文件中，使用的JkMount和JkUnMount这两个指令是由mod_jk提供的，JkMount指令把请求转给tomcat,与之相反的是JkUnMount不转发请求。下面是我的配置:
JkEnvVar REMOTE_USER null
JkMount /*.jsp  ajp13_worker
JkMount /Test/*  ajp13_worker
JkUnMount /Test/ ajp13_workerJkEnvVar指令可以使从Apache转发环境变量给Tomcat。这些变量可以从Servlet中的request.getAttribute(attributeName)得到，但是通过JkEnvVar发送的变量名称不会出现在request.getAttributeNames()中。]]></description> <wfw:commentRss>http://blog.ossxp.com/2010/02/454/feed/</wfw:commentRss> <slash:comments>0</slash:comments> </item> <item><title>用Debian/Ubuntu提供的软件包整合apache2和tomcat6</title><link>http://blog.ossxp.com/2010/01/312/</link> <comments>http://blog.ossxp.com/2010/01/312/#comments</comments> <pubDate>Wed, 20 Jan 2010 13:57:01 +0000</pubDate> <dc:creator>王胜</dc:creator> <category><![CDATA[Java＆J2EE]]></category> <category><![CDATA[Apache]]></category> <category><![CDATA[Debian]]></category> <category><![CDATA[java]]></category> <category><![CDATA[Tomcat]]></category><guid
isPermaLink="false">http://blog.ossxp.com/?p=312</guid> <description><![CDATA[上篇日志写了用下载源码包的方式整合apache2和tomcat6，或许你会问：怎么不用Debian自己提供的软件包整合呢？
其实在我用下载源码包的方式成功整合apache2和tomcat6后，我就开始实验用Debian自己提供的软件包整合，可是摸索了好长时间，还是整合不成功 :-?  。今天在同事蒋鑫的帮助下，终于有了眉目 :-) 。下面是具体步骤：
1、安装 tomcat6
sudo aptitude  install tomcat6 tomcat6-docs tomcat6-admin tomcat6-examples
2、安装 apache2
sudo aptitude install apache2
3、安装apache-tomcat 连接器模组 libapache2-mod-jk
sudo aptitude install libapache2-mod-jk
4、配置jk
cd /etc/apache2/mods-available
/etc/apache2/mods-available$ sudo vi jk.conf
jk.conf的内内容如下
# 指出jk模块工作所需要的工作文件workers.properties的位置
JkWorkersFile /etc/libapache2-mod-jk/workers.properties# Where to put jk logs
JkLogFile /var/log/apache2/mod_jk.log# Set the jk log level [debug/error/info]
JkLogLevel info# Select the log format
JkLogStampFormat "[%a %b %d %H:%M:%S %Y]"# JkOptions indicate to send SSL <a
href="http://blog.ossxp.com/2010/01/312/" class="more-link">阅读全部内容 &#187;</a>]]></description> <wfw:commentRss>http://blog.ossxp.com/2010/01/312/feed/</wfw:commentRss> <slash:comments>18</slash:comments> </item> <item><title>Linux下Apache与Tomcat的整合</title><link>http://blog.ossxp.com/2010/01/296/</link> <comments>http://blog.ossxp.com/2010/01/296/#comments</comments> <pubDate>Tue, 19 Jan 2010 03:42:07 +0000</pubDate> <dc:creator>王胜</dc:creator> <category><![CDATA[Java＆J2EE]]></category> <category><![CDATA[Apache]]></category> <category><![CDATA[Debian]]></category> <category><![CDATA[java]]></category> <category><![CDATA[Tomcat]]></category><guid
isPermaLink="false">http://blog.ossxp.com/?p=296</guid> <description><![CDATA[背景介绍：
Apache的HTTPD是目前比较受欢迎的网站服务器软件，它不但功能强大，而且完全免费，并且支持市场上流行的各种操作系统(Windows,Linux,Mac os)。同时对于Java Servlet/JSP的支持，通常也会使用同样Apache出品的Tomcat。Tomcat除了支持Java Servlet/JSP之外，也可以当做网站服务器使用，但是在对于静态的html文件、图片文件等的解析效率上不如Apache HTTPD的执行效率高。应用tomcat的服务器如果网站的访问量较大，系统资源占用会明显升高。所以就引出Tomcat与apache的整合服务。Apache负责静态资源处理，tomcat负责jsp和java servlet等动态资源的处理。
需要的组件：
1、apache
下载地址：http://httpd.apache.org/download.cgi
2、Tomcat
下载地址：http://tomcat.apache.org/download-60.cgi
3、Apache Tomcat Connector (mod_jk)
下载地址：http://www.apache.org/dist/tomcat/tomcat-connectors/jk/binaries/
根据你的操作系统选择适当的 jk 连接器，同时要注意你用的Apache版本，根据你的Apache版本下载合适的jk版本。
下面是apache与jk的兼容性映射mod_jk-1.2.28-httpd-2.2.X.so is for Apache 2.2.x. It has been build against version 2.2.6, but should work with Apache 2.2.0 and later. Rename to mod_jk.so before putting it in your modules directory or adjust your LoadModule statement.
mod_jk-1.2.28-httpd-2.0.X.so is for Apache 2.0.x. It has been build <a
href="http://blog.ossxp.com/2010/01/296/" class="more-link">阅读全部内容 &#187;</a>]]></description> <wfw:commentRss>http://blog.ossxp.com/2010/01/296/feed/</wfw:commentRss> <slash:comments>0</slash:comments> </item> </channel> </rss>
<!-- Performance optimized by W3 Total Cache. Learn more: http://www.w3-edge.com/wordpress-plugins/

Minified using disk
Page Caching using disk (user agent is rejected)
Database Caching 8/16 queries in 0.007 seconds using disk

Served from: blog.ossxp.com @ 2012-02-11 06:01:02 -->
