爬取股票网站,可以看到打开谷歌浏览器,抓取页面内容点击下一页进行多页面抓取。 代码抓取了3页的内容,用于学习使用。需要安装selenium库 执行效果如下?
整理之后并在一行打印出来, 没有过多的对内容来做排版def sj(driver): xpath *tbodytrtd # xpaths for j in range(1, 21): for
然后获取内容并逐行打印, 内容打印完毕后,抓取下一页的位置,单击延时3秒,等待页面内容刷新,不然会出现意外 tt 序号tt代码tt名称tt相关链接tt最新价tt涨跌幅tt涨跌额tt成交量(手)tt成交额tt振幅
driver.get(http:quote.eastmoney.comcentergridlist.html#sh_a_board) # 访问股票网站# xpathtt 序号tt代码tt名称tt相关链接
tt最新价tt涨跌幅tt涨跌额tt成交量(手)tt成交额tt振幅tt最高tt最低tt今开tt昨收tt量比tt换手率tt市盈率(动态)tt市净率print(tt)for i in range(3): sj