网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
软件 | 笔趣阁小说爬取工具【附源码】 v2.21 |
分类 | 网络软件 |
语言 | 简体中文 |
大小 | 15MB |
版本 | |
下载 | ![]() |
介绍 | 笔趣阁小说爬取工具【附源码】 v2.21 一大闻鸡起舞腹便便应俱全23. 好好的笑,好好的过,好好的一辈子。活着,就是一种心态,你若觉得快乐,幸福无处不在;你为自己悲鸣,世界必将灰暗。上课之前,你最好准备充分并且对唐朝历史有一个简单的了解,这会使你上起课来更容易。219.天长地久有时尽,此恨绵绵无绝期。《长恨歌》 笔趣阁小说爬取工具针对笔趣阁网站开发,由论坛用户原创制作并分享,基于Python编写,能够帮助喜欢阅读小说的用户们将自己喜欢的文章下载到电脑上,让阅读进行得更加方便,软件免费实用,直接爬取网站下载小说资源,让用户轻松获取想看的小说,软件附源码。 软件使用 程序运行方法:解压,在本文件夹中找到并打开dist文件夹,有一个“笔趣阁小说下载.exe”,双击运行 1、前往http://www.xbiquge.la/,找到要保存的小说,复制那个小说的目录页链接 2、按要求输入链接地址和小说名 3、爬取开始 (因为是单线程运行,爬取速度略慢大概1-2秒一章) 4、爬取结束后,会将所有章节内容整合成一个txt文件 ![]() 软件源码 import requests import re header = { 'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.97 Safari/537.36' } #定义全局变量,用于保存所有获取到的小说内容 story_all = [] #获取标题及章节链接地址 def main(): url = input("请输入小说目录页地址(暂时仅支持‘http://www.xbiquge.la/’站内小说):") book_name = input("请输入小说名称:") print("-----爬取开始-----") #获取目录页的HTML文本 text = requests.get(url,header).content.decode('utf-8') #获取每个章节的章节名 title = re.findall(r' .*? (.*?)',text,re.DOTALL) #获取每个章节的链接地址 loca = re.findall(r" .*?='(.*?)' >",text,re.DOTALL) #因为title和loca的长度相同,所以以索引的方式遍历,方便取值 for i in range(len(title)): content(title[i],f'http://www.xbiquge.la{loca[i]}捶床拍枕拼音:chuí chuáng pāi zhěn释义:形容辗转难以入睡。同捶床捣枕”。出处:清·曾朴《孽海花》第三回他脾气越发坏了,不是捶床拍枕,就是咒天骂地。”示例:无9;) #小说爬取完毕,开始保存 print("@"*500) with open(r'%s.txt'%book_name, 'w',encoding='utf-8')as file: #遍历每一项,按顺序保存章节名和章节内容 for story in story_all: file.write(story['title']+' ') print(story['title']) file.write(story['story']) #解析章节内容并保存 def content(title,url): #获取章节页的HTML文本 text = requests.get(url,header).content.decode('utf-8') #因为之前写过直接爬取所有内容的,爬取出来的文本都带有不好处理 #所以就一句一句的获取了 story_content = re.findall(r' (.*?)<br',text,re.DOTALL) #因为章节名中有“”空格,没办法作为文件名,所以把空格去掉 title = re.sub(' ','-',title) #有时候不知道为什么小说内容会爬取到一个空数组,所以这里添加了一个检测程序 #如果爬取到的为空,就重新爬取,直到获取到为止 if story_content==[]: content(title,url) return 0 story="" #前面提到,因为我是一句一句爬取的,所以这里做一下拼接,顺便去空格 for story_contents in story_content: story = story+story_contents.strip()+' ' #将章节名称和章节内容保存为一个字典 this_story = { "title":title, "story":story } print(this_story['title']) #将字典添加到开头定义的全局变量中 story_all.append(this_story) if __name__ == "__main__": main() 喜欢小编为您带来的笔趣阁小说爬取工具【附源码】吗?希望可以帮到您~更多软件下载尽在101bt软件下载网。 黛蛾长敛,任是春风吹不展。 困倚危楼,过尽飞鸿字字愁。竹怜新雨后,山爱夕阳时。笔趣阁小说爬取工具【附源码】The suggested reason for buying the car is obvious: it is the intelligent choice.(注意冒号的使用) |
截图 | |
随便看 |
|
霍普软件下载网-旗舰软件下载站,将绿色免费商业版破解软件、共享软件、游戏、电影、电视剧一网打尽!