基于此,小编爬取了拉勾网上面关于数据分析的招聘信息,并存储到MySQL数据库,最后进行数据分析。
1、爬虫
----
爬虫部分非常简单,对网页稍加分析便能完成。
可以直观看见每一条招聘信息都存储在json里面。那么我们通过访问URL就可以获取到这些信息了。这里需要强调的是,拉勾网最多只会展示30页内容,每页15条。
考虑到招聘信息的实时性,最终小编爬取了100页数据,共计1500条招聘信息。
?
2、数据分析
----
由于这次爬取的数据属性比较多,我们分别从单变量,多变量来进行数据可视化。
城市分布
?
所以投递简历的时候可以关注公司这些部门的招聘信息。
薪水
?
招聘类型
?
我们爬取的招聘信息招聘全职为主,实习和兼职招聘的很少。
工作经验
?
大部分招聘都是需要一定的工作经验的,这跟招聘的类型主要是全职的为主,一般招聘全职都需要具有工作经验。