gk2004busy 发表于 2010-5-7 07:52:50

【转自JavaEye】喜欢性能调优的同学可以看看,标题:sun的程序员也是程序员啊!

原文链接:http://www.javaeye.com/topic/659687

主题:sun的程序员也是程序员啊!


    依然是近期工作中发现的问题,真实案例,写下来分享给大家。

    在开始本文之前,援引同事对此案例的一句评语:sun的程序员也是程序员啊!

    开始讲故事吧,依然是performance tuning,还是老伎俩,加压力,做thread dump,然后检查。结果就发现有如下的线程,而且比率极大:dump出来大概总共70-80个工作线程,有5-6个在做这个事情,还有大概50个在等着做这个事情,也就是说大概80%+的工作线程都于此有关。" HTTPBC-OutboundReceiver-221 " daemon prio = 3 tid = 0x09872c00 nid = 0x4bf9 runnable [ 0xa7b56000 ]
   java.lang.Thread.State: RUNNABLE
    at java.util.zip.ZipFile.getEntry(Native Method)
    at java.util.zip.ZipFile.getEntry(ZipFile.java: 149 )
    - locked < 0xbb09d458 > (a java.util.jar.JarFile)
    at java.util.jar.JarFile.getEntry(JarFile.java: 206 )
    at java.util.jar.JarFile.getJarEntry(JarFile.java: 189 )
    at sun.misc.URLClassPath$JarLoader.getResource(URLClassPath.java: 754 )
    at sun.misc.URLClassPath$JarLoader.findResource(URLClassPath.java: 732 )
    at sun.misc.URLClassPath$ 1 .next(URLClassPath.java: 195 )
    at sun.misc.URLClassPath$ 1 .hasMoreElements(URLClassPath.java: 205 )
    at java.net.URLClassLoader$ 3 $ 1 .run(URLClassLoader.java: 393 )
    at java.security.AccessController.doPrivileged(Native Method)
    at java.net.URLClassLoader$ 3 .next(URLClassLoader.java: 390 )
    at java.net.URLClassLoader$ 3 .hasMoreElements(URLClassLoader.java: 415 )
    at sun.misc.CompoundEnumeration.next(CompoundEnumeration.java: 27 )
    at sun.misc.CompoundEnumeration.hasMoreElements(CompoundEnumeration.java: 36 )
    at sun.misc.CompoundEnumeration.next(CompoundEnumeration.java: 27 )
    at sun.misc.CompoundEnumeration.hasMoreElements(CompoundEnumeration.java: 36 )
    at sun.misc.CompoundEnumeration.next(CompoundEnumeration.java: 27 )
    at sun.misc.CompoundEnumeration.hasMoreElements(CompoundEnumeration.java: 36 )
    at sun.misc.CompoundEnumeration.next(CompoundEnumeration.java: 27 )
    at sun.misc.CompoundEnumeration.hasMoreElements(CompoundEnumeration.java: 36 )
    at sun.misc.CompoundEnumeration.next(CompoundEnumeration.java: 27 )
    at sun.misc.CompoundEnumeration.hasMoreElements(CompoundEnumeration.java: 36 )
    at com.sun.xml.ws.util.ServiceFinder$LazyIterator.hasNext(ServiceFinder.java: 357 )
    at com.sun.xml.ws.api.pipe.TransportTubeFactory.create(TransportTubeFactory.java: 129 )
    at com.sun.xml.ws.transport.DeferredTransportPipe.processRequest(DeferredTransportPipe.java: 112 )
    at com.sun.xml.ws.api.pipe.Fiber.__doRun(Fiber.java: 595 )
    at com.sun.xml.ws.api.pipe.Fiber._doRun(Fiber.java: 554 )
    at com.sun.xml.ws.api.pipe.Fiber.doRun(Fiber.java: 539 )
    at com.sun.xml.ws.api.pipe.Fiber.runSync(Fiber.java: 436 )
    - locked < 0xe8e3e200 > (a com.sun.xml.ws.api.pipe.Fiber)
    at com.sun.xml.ws.api.pipe.helper.AbstractTubeImpl.process(AbstractTubeImpl.java: 106 )
    at com.sun.xml.ws.tx.client.TxClientPipe.process(TxClientPipe.java: 177 )
    at com.sun.xml.ws.api.pipe.helper.PipeAdapter.processRequest(PipeAdapter.java: 115 )
    at com.sun.xml.ws.api.pipe.Fiber.__doRun(Fiber.java: 595 )
    at com.sun.xml.ws.api.pipe.Fiber._doRun(Fiber.java: 554 )
    at com.sun.xml.ws.api.pipe.Fiber.doRun(Fiber.java: 539 )
    at com.sun.xml.ws.api.pipe.Fiber.runSync(Fiber.java: 436 )
    - locked < 0xe8e3e200 > (a com.sun.xml.ws.api.pipe.Fiber)
    at com.sun.xml.ws.client.Stub.process(Stub.java: 248 )
    at com.sun.xml.ws.client.dispatch.DispatchImpl.doInvoke(DispatchImpl.java: 180 )
    at com.sun.xml.ws.client.dispatch.DispatchImpl.invoke(DispatchImpl.java: 206 )
    at com.sun.jbi.httpsoapbc.OutboundMessageProcessor.outboundCall(OutboundMessageProcessor.java: 1256 )
    at com.sun.jbi.httpsoapbc.OutboundMessageProcessor.dispatch(OutboundMessageProcessor.java: 1296 )
    at com.sun.jbi.httpsoapbc.OutboundMessageProcessor.processRequestReplyOutbound(OutboundMessageProcessor.java: 747 )
    at com.sun.jbi.httpsoapbc.OutboundMessageProcessor.processMessage(OutboundMessageProcessor.java: 257 )
    at com.sun.jbi.httpsoapbc.OutboundAction.run(OutboundAction.java: 63 )
    at java.util.concurrent.ThreadPoolExecutor$Worker.runTask(ThreadPoolExecutor.java: 886 )
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java: 908 )
    at java.lang.Thread.run(Thread.java: 619 )



    忘了介绍一下背景:openESB运行于 glassfish平台,一个bepl 调用4个webservice.上面的线程HTTPBC-OutboundReceiver 是openESB中作为客户端调用webservice的工作线程,从调用栈中可以看到:
1. task被executor执行
2. jbi中的httpsoapbc用来处理消息
3. com.sun.xml.ws.client使用Stub来处理信息,标准的webservice调用
4. 最重要的两行,我们后面再来看这里发生了什么
    at com.sun.xml.ws.api.pipe.TransportTubeFactory.create(TransportTubeFactory.java:129)
    at com.sun.xml.ws.transport.DeferredTransportPipe.processRequest(DeferredTransportPipe.java:112)
5. ServiceFinder,通过Iterator.hasNext在做游历
6. java的classloader在find resource
7. 为了从jar包中装载resouce,需要处理解压缩,java.util.zip被调用

    OK,现在整体看,在处理webservice的调用过程中,需要在classpath路径下载入资源,而且看样子这个资源的载入还是很耗cpu时间的。

gk2004busy 发表于 2010-5-7 07:53:10

本帖最后由 gk2004busy 于 2010-5-7 07:56 编辑

先看看在装载什么资源,上面的调用明显是jax-ws,glassfish下跑的是metro的实现。在glassfish目录下找到webservice-rt.jar,打开看META-INF/MANIFEST.MF,找到Name: jaxws-rt.jar这段,发现有Implementation-Version: 2.1.3.1,上metro的官网,找metor 相应版本的源文件,最接近的是2.1.3。下载下来查看源码,恩,开源就是好啊。

    首先找到ServiceFinder类,代码片段:com.sun.xml.ws.util.ServiceFinder$LazyIterator.hasNext(ServiceFinder.java: 357 )
private static final Stringprefix = " META-INF/services/ " ;
    if (configs == null ) {
      String fullName = prefix + service.getName();
            if (loader == null )
                configs = ClassLoader.getSystemResources(fullName);
            else
                configs = loader.getResources(fullName);
    }


    非常通用的做法,META-INF/services/下查找资源看改用哪个实现。

    逆推找到类TransportTubeFactory中对此的调用代码:
    public static Tube create(@Nullable ClassLoader classLoader,
                                 @NotNull ClientTubeAssemblerContext context) {
       for (TransportTubeFactory factory : ServiceFinder.find(TransportTubeFactory. class ,classLoader)) {
            Tube tube = factory.doCreate(context);
             if (tube != null ) {
                TransportTubeFactory.logger.fine(factory.getClass() + " successfully created " + tube);
                return tube;
            }
      }


    代码的意图很明显,create()方法在classpath下找到TransportTubeFactory的实现,然后逐个尝试创建Tube对象。

    疑问就来了,为什么每次请求都要create, 这里的create明显是重量级的,需要到classpath下去查找一下某个Factory的实现。明显不合理,继续逆推代码,在类DeferredTransportPipe中找到对create的调用:
    public NextAction processRequest(@NotNull Packet request) {
       if (request.endpointAddress == address)
             // cache hit
             return transport.processRequest(request);
      .....
      address = request.endpointAddress;
      transport = TransportTubeFactory.create(classLoader, newContext);


    不出意料的,这里有cache: 如果endpoint address和上次相同,直接重用,否则就调用create方法。从前面的现象看,cache没有命中,至少没有全部命中。

    由于我们的测试的案例是连续调用4个不同的webservice,当然每个webservice的endpoint address是不同的。因此第一反应是这里transport cache机制被四个webservice的client端公用,因此每次调用只有1/4的概率和上次相同,其他的3/4就只能重新创建。之后花费了大量时间和精力去查看openesb的代码,过程不提,结果就是无果。

    再回头来看这个cache的地方,有点奇怪为什么不命中。好在可以做remote debug,debug进入,到if(request.endpointAddress==address ) 这行,发现果然没有命中,但是随即检查request.endpointAddress和 address的值,非常惊讶的发现里面的实际值是相同的!!

    直接晕倒!if (request.endpointAddress == address )



    值相同而==不成立,那么就是说这里的request.endpointAddress 和 address 并不是一般的enum或者类型安全枚举, ==的检测根本不成立。

    这是sun的代码啊,sun的程序员也会犯这种低级错误?用 == 来比较普通对象而不是用equals()方法?

    继续看EndpointAddress 这个类,无语了:

1. 这是个普通的类,根本不是enum或者类型安全枚举,有两个publish的构造函数,理论上,使用者可以随意创建任意数量的实例
2. 没有重载equals方法,因此即使改用equals方法来提到==的检查也是无意义的,默认的equals()还是检查对象引用

    因此,再来看DeferredTransportPipe中的这段试图重用cache的代码
    public NextAction processRequest(@NotNull Packet request) {
       if (request.endpointAddress == address)
             // cache hit
             return transport.processRequest(request);


    这里的"if(request.endpointAddress==address)"能否成立,完全取决于客户端的调用方法:如果调用方保证每次相同endpointAddress的请求,request.endpointAddress都会是同一个实例,则这里的cache可以命中。否则这个cache毫无意义,还是需要每次重新创建重量级的transport对象。我们的测试案例中,很明显,openESB的程序员,没有考虑到DeferredTransportPipe这里的"特殊"要求,每次调用传入的request.endpointAddress虽然里面的实际值相同,但是每次都是不同的实例。因此 == 不成立,cache不命中。

    查找了一下相关的类和接口定义,对于方法public NextAction processRequest(Packet request) 和 Packet中的endpointAddress属性,没有任何javadoc说明要求Packet中的endpointAddress属性需要做到相同地址只使用一个对象实例。

    看Packet中的endpointAddress的设值代码:
    public void setEndPointAddressString(String s) {
       if (s == null )
             this .endpointAddress = null ;
       else
             this .endpointAddress = EndpointAddress.create(s);
    }
    public static EndpointAddress create(String url) {
       try {
             return new EndpointAddress(url);
      } catch (URISyntaxException e) {
             throw new WebServiceException( " Illegal endpoint address: " + url,e);
      }
    }


    明显每次通过调用setEndPointAddressString()设置时都会产生一个新的EndpointAddress实例。看代码时还意外的发现,
public EndpointAddress endpointAddress;


    这个endpointAddress属性居然是public的!! 看样子,DeferredTransportPipe类的开发者,是寄希望于调用者不要通过Packet.setEndPointAddressString(String s)来设置,而是希望直接使用public的属性,这样才有希望命中cache!这分明是在挖坑,而且明显现在openESB的开发者被坑进去了!

    鄙视啊鄙视,这样的代码,居然是sun的程序员写出来的,还放在metro里面,而metro作为默认的jax-ws实现被放在jdk中...... 很是无语。

    无奈之下,修改代码,将 == 去掉,自己简单的判断一下endpointAddress的实际值
      if (address != null && address.getURI() != null
             && request.endpointAddress.getURI().equals(address.getURI())) {
             // cache hit
             return transport.processRequest(request);
      }


    将编译出来的class文件,替换glassfish/lib/webservice-rt.jar中的相同文件,重新测试。再次thread dump,发现问题解决了。

    期间看了一下DeferredTransportPipe类的各个version的代码,这里的 == 一直都没有改,难道sun就一直没有发现这里有问题?有兴趣的可以通过下面的地址使用fisheye来查看这个类的代码:

http://fisheye5.cenqua.com/browse/jax-ws-sources/jaxws-ri/rt/src/com/sun/xml/ws/transport/DeferredTransportPipe.java?r1=1.3&r2=1.3.4.1&u=-1


    总结:用 == 来比较非enum或者类型安全枚举的对象实例,这种错误一般只有初学者才犯,万万没有想到,在metro这样级别的代码中也能出现。无限感叹啊,再次援引同事的评语作为本文的结束语:

    sun的程序员也是程序员啊!

集大某豆 发表于 2010-5-7 11:07:16

:m20纯粹来帮顶的。。。

完全看不懂。。

gk2004busy 发表于 2010-5-7 12:48:50

回复 3# 小E


    傻丫头,最近连发的几篇文章都是有用意的,希望能够激励在坛子里游荡的有想法的IT工程师苗子~~~~

集大某豆 发表于 2010-5-7 12:50:26

回复 4# gk2004busy


    :loveliness: 继续帮顶。

曉輪回 发表于 2010-5-9 01:18:33

呵呵,没打算学JAVA

gk2004busy 发表于 2010-5-17 23:02:46

回复 6# longcjx


    :)看个人喜好了

|.|.國王.饒舎. 发表于 2010-5-18 09:37:11

眼花。:sleep

《つ乜許。 发表于 2010-5-18 10:44:16

路过·················································································································································································

曉輪回 发表于 2010-5-18 15:12:25

回复longcjx


      看个人喜好了
gk2004busy 发表于 2010-5-17 23:02 http://www.chengyi.org/bbs/images/common/back.gif


    :) 不知学长可以介绍学VC++的人给我不,我目前在学这方面

gk2004busy 发表于 2010-5-19 19:41:04

回复 10# longcjx


    c和c++的有,VC的还真不清楚~~~公司这边服务器都是linux的~~

gk2004busy 发表于 2010-5-19 19:42:03

回复 8# |.|.國王.饒舎.


    眼花总是难免的……你又何苦一网情深……

曉輪回 发表于 2010-5-19 20:16:41

回复longcjx


    c和c++的有,VC的还真不清楚~~~公司这边服务器都是linux的~~
gk2004busy 发表于 2010-5-19 19:41 http://www.chengyi.org/bbs/images/common/back.gif


    嗯,就是要c和c++的

AK47 发表于 2010-5-21 09:11:48

求翻译成中文。。

gk2004busy 发表于 2010-5-23 21:08:18

本帖最后由 gk2004busy 于 2010-5-24 00:29 编辑

回复 13# longcjx


    以后工作之前到一些公司做实习的话,会有机会接触到许多牛人,在校期间还是先打牢基础比较重要
页: [1] 2
查看完整版本: 【转自JavaEye】喜欢性能调优的同学可以看看,标题:sun的程序员也是程序员啊!