详细信息页主要分成两部分:基础信息和其他信息。由于不同信息类型会有不同的小标题,因此提取内容时,用if先进行判断有无该小标题,若有,则将内容赋值,若无,则将该小标题赋空值,防止因为无法找到该小标题,从而影响整页文书的爬取。
基础信息都在fullJudgement下面,直接提取出来即可,并放入Basic_Information列表中。
其他信息是在fullJudgement下面的paragraphs下面,所以要先将paragraphs提取出来,再一一将其他小标题提取出来,再放入Document_body列表中。