学习计划(06.11-06.18)
任务:HtmlParser的包,包括tags,nodes和visitors的掌握
要求:1、认真理解各包内的类, 2、测试各包内的各类, 3、能熟练综合运用上面的包。
分工:每两天解决一个包,最后一天综合运用
时间:每天上午两小时,下午两小时,晚上两小时
坚持坚持~~
步骤:
1、会将整个页面生成Node树(包括树的遍历,树的访问情况)
2、会判断Node的类型(判断各类型的有哪些node)
3、会调用不同类型的Node的成员函数(API)
4、测试Tags里面的各个类的使用
5、测试用Visitors包内的类
结论:
1、·结点是以html为始开始计算,自定义标签的开头与结尾均算一个独立结点.
·html标签前的一个或多个换行算一个独立结点,html标签之后的一个或多个换行算一个独立结点
·html之前或之后的一个或多个字符算各算一个独立结点
·Node树的遍历,编写函数.完成了Node结点的高度求解。并不知道父子关系
·树的生成是按照嵌套来的,类似于树的定义
2、·RearkNode一般时div标签等,TextNode是文本内容,TagNode是除了前两项的所有标签
3、·测试各Tags内的成员函数
4、·找到一个环境,知道什么时候会用Visitors里的包
·再测试各类