首先去除《 网络红人、演员、电竞人物、影视幕后人物、音乐人物、明星组合、虚拟人物、体育人物》。
、轶事典故、史料记载、艺术形象、亲属成员、人物评价
文化任务:人物经历、个人生活、个人作品、主要贡献、获奖记录、人物评价
科学人物:人物经历、个人生活、研究方向、主要成就、所获荣誉、社会任职、人物影响
return para
def get_item(url):
doc requests.get(url,headersheaders).text
e etree.HTML
.join(e.xpath(//div[@class"summary-pic"]/a/img/@src))
#print("封面图片:",item[pic])
# 个人简介
labels []
if experiences:
exper .join(experiences)
ex etree.HTML