一、数据获取我们的数据来源是链接网上的信息,应该还挺全的,虽然最近它在裁员....这就是我们需要的数据页面了爬取各个行政区房源信息,并数据保存为DataFrame,话不多说,直接上代码:area_dic
{罗湖区:luohuqu, 福田区:futianqu, 南山区:nanshanqu, 盐田区:yantianqu, 宝安区:baoanqu, 龙岗区:longgangqu, 龙华区:longhuaqu
, 坪山区:pingshanqu} # 加个header以示尊敬headers {User-Agent: Mozilla5.0 (Windows NT 10.0; Win64; x64) AppleWebKit537.36
*二手房, html).strip() print({}: 二手房源共计「{}」套.format(key_, house_num)) time.sleep(1) # 页面限制 每个行政区只能获取最多100
页共计3000条房源信息 total_page int(math.ceil(min(3000, int(house_num)) 30.0)) for i in tqdm(range(total_page