HttpClient 教程 (六)

HttpClient教程(六)

第六章高级主题

6.1自定义客户端连接

在特定条件下,也许需要来定制HTTP报文通过线路传递,越过了可能使用的HTTP参数来处理非标准不兼容行为的方式。比如,对于Web爬虫,它可能需要强制HttpClient接受格式错误的响应头部信息,来抢救报文的内容。

通常插入一个自定义的报文解析器的过程或定制连接实现需要几个步骤:

提供一个自定义LineParser/LineFormatter接口实现。如果需要,实现报文解析/格式化逻辑。

classMyLineParserextendsBasicLineParser{

@Override

publicHeaderparseHeader(

finalCharArrayBufferbuffer)throwsParseException{

try{

returnsuper.parseHeader(buffer);

}catch(ParseExceptionex){

//压制ParseException异常

returnnewBasicHeader("invalid",buffer.toString());

}

}

}

提过一个自定义的OperatedClientConnection实现。替换需要自定义的默认请求/响应解析器,请求/响应格式化器。如果需要,实现不同的报文写入/读取代码。

classMyClientConnectionextendsDefaultClientConnection{

@Override

protectedHttpMessageParsercreateResponseParser(

finalSessionInputBufferbuffer,

finalHttpResponseFactoryresponseFactory,

finalHttpParamsparams){

returnnewDefaultResponseParser(buffer,

newMyLineParser(),responseFactory,params);

}

}

为了创建新类的连接,提供一个自定义的ClientConnectionOperator接口实现。如果需要,实现不同的套接字初始化代码。

classMyClientConnectionOperatorextends

DefaultClientConnectionOperator{

publicMyClientConnectionOperator(

finalSchemeRegistrysr){

super(sr);

}

@Override

publicOperatedClientConnectioncreateConnection(){

returnnewMyClientConnection();

}

}

为了创建新类的连接操作,提供自定义的ClientConnectionManager接口实现。

classMyClientConnManagerextendsSingleClientConnManager{

publicMyClientConnManager(

finalHttpParamsparams,

finalSchemeRegistrysr){

super(params,sr);

}

@Override

protectedClientConnectionOperatorcreateConnectionOperator(

finalSchemeRegistrysr){

returnnewMyClientConnectionOperator(sr);

}

}

6.2有状态的HTTP连接

HTTP规范假设session状态信息通常是以HTTPcookie格式嵌入在HTTP报文中的,因此HTTP连接通常是无状态的,这个假设在现实生活中通常是不对的。也有一些情况,当HTTP连接使用特定的用户标识或特定的安全上下文来创建时,因此不能和其它用户共享,只能由该用户重用。这样的有状态的HTTP连接的示例就是NTLM认证连接和使用客户端证书认证的SSL连接。

6.2.1用户令牌处理器

HttpClient依赖UserTokenHandler接口来决定给定的执行上下文是否是用户指定的。如果这个上下文是用户指定的或者如果上下文没有包含任何资源或关于当前用户指定详情而是null,令牌对象由这个处理器返回,期望唯一地标识当前的用户。用户令牌将被用来保证用户指定资源不会和其它用户来共享或重用。

如果它可以从给定的执行上下文中来获得,UserTokenHandler接口的默认实现是使用主类的一个实例来代表HTTP连接的状态对象。UserTokenHandler将会使用基于如NTLM或开启的客户端认证SSL会话认证模式的用户的主连接。如果二者都不可用,那么就不会返回令牌。

如果默认的不能满足它们的需要,用户可以提供一个自定义的实现:

DefaultHttpClienthttpclient=newDefaultHttpClient();

httpclient.setUserTokenHandler(newUserTokenHandler(){

publicObjectgetUserToken(HttpContextcontext){

returncontext.getAttribute("my-token");

}

});

6.2.2用户令牌和执行上下文

在HTTP请求执行的过程中,HttpClient添加了下列和用户标识相关的对象到执行上下文中:

'http.user-token':对象实例代表真实的用户标识,通常期望Principle接口的实例。

我们可以在请求被执行后,通过检查本地HTTP上下文的内容,发现是否用于执行请求的连接是有状态的。

DefaultHttpClienthttpclient=newDefaultHttpClient();

HttpContextlocalContext=newBasicHttpContext();

HttpGethttpget=newHttpGet("http://localhost:8080/");

HttpResponseresponse=httpclient.execute(httpget,localContext);

HttpEntityentity=response.getEntity();

if(entity!=null){

entity.consumeContent();

}

ObjectuserToken=localContext.getAttribute(ClientContext.USER_TOKEN);

System.out.println(userToken);

6.2.2.1持久化有状态的连接

请注意带有状态对象的持久化连接仅当请求被执行时,相同状态对象被绑定到执行上下文时可以被重用。所以,保证相同上下文重用于执行随后的相同用户,或用户令牌绑定到之前请求执行上下文的HTTP请求是很重要的。

DefaultHttpClienthttpclient=newDefaultHttpClient();

HttpContextlocalContext1=newBasicHttpContext();

HttpGethttpget1=newHttpGet("http://localhost:8080/");

HttpResponseresponse1=httpclient.execute(httpget1,localContext1);

HttpEntityentity1=response1.getEntity();

if(entity1!=null){

entity1.consumeContent();

}

Principalprincipal=(Principal)localContext1.getAttribute(

ClientContext.USER_TOKEN);

HttpContextlocalContext2=newBasicHttpContext();

localContext2.setAttribute(ClientContext.USER_TOKEN,principal);

HttpGethttpget2=newHttpGet("http://localhost:8080/");

HttpResponseresponse2=httpclient.execute(httpget2,localContext2);

HttpEntityentity2=response2.getEntity();

if(entity2!=null){

entity2.consumeContent();

}

相关推荐