某大型的教育百科数据采集规则,数据有200w左右,全站采集规则,可以进行学习使用。 采集规则要求: 规则有两个,因为站点数据模板有不同,所以写了两个规则,可以一起并行跑 数据过滤了不需要的字符,只保留了段落标签 导入要求:火车头9.8以上版本