本周结节

学习计划（06.11-06.18）

任务：HtmlParser的包，包括tags,nodes和visitors的掌握

要求：1、认真理解各包内的类， 2、测试各包内的各类， 3、能熟练综合运用上面的包。

分工：每两天解决一个包，最后一天综合运用

时间：每天上午两小时，下午两小时，晚上两小时

坚持坚持~~

步骤：

1、会将整个页面生成Node树（包括树的遍历，树的访问情况）

2、会判断Node的类型(判断各类型的有哪些node)

3、会调用不同类型的Node的成员函数（API）

4、测试Tags里面的各个类的使用

5、测试用Visitors包内的类

结论：

1、·结点是以html为始开始计算，自定义标签的开头与结尾均算一个独立结点.

·html标签前的一个或多个换行算一个独立结点，html标签之后的一个或多个换行算一个独立结点

·html之前或之后的一个或多个字符算各算一个独立结点

·Node树的遍历，编写函数.完成了Node结点的高度求解。并不知道父子关系

·树的生成是按照嵌套来的，类似于树的定义

2、·RearkNode一般时div标签等,TextNode是文本内容，TagNode是除了前两项的所有标签

3、·测试各Tags内的成员函数

4、·找到一个环境，知道什么时候会用Visitors里的包

·再测试各类

posted on 2009-06-20 01:56 Lowden 阅读(47) 评论(0) 编辑收藏所属分类: Java - HtmlParser

只有注册用户登录后才能发表评论。



网站导航: 博客园 IT新闻知识库 Java博客 C++博客博问
相关文章: javascript操作txt文件 JAVA操作excel文件 JAVA常用基础代码 java 模拟浏览器发出post请求用htmlparser分析并抽取正文 HTMLParser Node和Tag综合测试关于HtmlParser中visitors的测试关于HTMLPARSER中的Node 的测试学习计划（06.19-06.25）

Lowden