话不多说,开整...
02
什么是爬虫
对于这种问题,我们可以直接去百度百科看介绍,网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本
现在的爬虫基本上都是围绕web网页的,所以我们爬虫就是根据网页地址(URL)爬取网页内容,网页地址就是我们在浏览器中输入的网站链接。
由于本人不看小说,所以直接去小说排行榜选了第一名,《三国之他们非要打种地的我》。名字就很有吸引力嘛!!!!
2. 相关技术介绍
本次教程使用两种语言进行开发,分别是Golang和Python。
server "https://www.xsbiquge.com"
target "https://www.xsbiquge.com/91_91600/"
book_name 三国之他们非要打种地的我
写入文件时,写完文章要换行换行,遇到br标签,就要进行换行,这样的文章才能有一个耐看的排版,Golang代码样例如下:
text,err : os.Create("三国之他们非要打种地的我.txt