Lowden

now

关于HtmlParser中visitors的测试

/**
 * @(#)VisitorsTest.java
 *
 *
 * @author
 * @version 1.00 2009/6/18
 */
import org.htmlparser.Parser;
import org.htmlparser.Node;
import org.htmlparser.util.NodeList;
import org.htmlparser.nodes.*;
import org.htmlparser.visitors.*;
import org.htmlparser.Tag;
import org.htmlparser.tags.*;

public class VisitorsTest extends  NodeVisitor{

    public VisitorsTest() {
    }
   
    public static void main(String args[]){
     
     try{
      String path="file:///c:/htmlparsertest.html"; 
   
      Parser pr = new Parser(path);
     // pr.setURL("http://www.suse.edu.cn");
      VisitorsTest vt = new VisitorsTest();
      pr.visitAllNodesWith(vt);
     }
     catch(Exception e){
      e.printStackTrace();
     }
    }
    
     public void visitTag (Tag tag)
     {
         System.out.print ("\nTagName:" + tag.getTagName () );
         if(tag instanceof LinkTag){
          LinkTag lt = (LinkTag)tag;
          System.out.print(" LinkTag is:"+ lt.extractLink());
          
         }
         else if(tag instanceof FormTag){
          FormTag ft = (FormTag)tag;
          System.out.print(" FormTag is:"+ft.getFormName());
         }
         else if(tag instanceof ImageTag){
          ImageTag it = (ImageTag)tag;
          System.out.print(" ImageTag  url is:"+it.getImageURL());
         }
         else {
          System.out.print(" OtherTag");
         }
     }

   
}

posted on 2009-06-20 17:33 Lowden 阅读(86) 评论(0)  编辑  收藏 所属分类: Java - HtmlParser

My Links

Blog Stats

常用链接

留言簿

随笔分类

随笔档案

文章分类

文章档案

好友链接

搜索

最新评论

阅读排行榜

评论排行榜