《斗破苍穹第三季》在线观看-樱花动漫
cac55 2025-11-03 18:24 2 浏览
大家好,我是辣条。
最近被室友安利热血动漫番《终末的女武神》和《拳愿阿修罗》,太上头了周末休息熬夜看完了。不过资源不太好找,辣条一怒爬取了资源,这下可以看个够了。室友崇拜连连,想起了我的班花,快点开学啊,阿西吧...
Python爬虫-vip动漫采集
效果展示
爬取目标
网站目标:樱花动漫
工具使用
开发工具:pycharm
开发环境:python3.7, Windows10
使用工具包:requests,lxml, re,tqdm
重点学习内容
正则的使用 tqdm的使用 各种音频数据的处理
项目思路解析
搜索你需要的动漫数据,根据自己需要的视频不同解析视频的方法也是不一样的(会挑选两种视频进行解析)
在当前页面需要提取出对应的章节信息,获取到章节信息的a标签的跳转内容,提取出每个章节的名字,提取章节的方法我使用的xpath的方法(各位大佬可自行尝试其他的方法)
headers = {
User-Agent: Mozilla/ (Windows NT ; Win64; x64) AppleWebKit/ (KHTML, like Gecko) Chrome/ Safari/,
Referer: http://www.imomoe.la/search.asp
}
url = http://www.imomoe.la/view/.html
response = requests.get(url, headers=headers)
# print(response.content.decode(gbk))
html_data = etree.HTML(response.content.decode(gbk))
chapter_list = html_data.xpath(//div[@class=movurl]/ul/li/a/text())
chapter_url_list = html_data.xpath(//div[@class=movurl]/ul/li/a/@href)[0]url的数据需要自行拼接,根据新的url获取详情页面的数据
按照正常思路首先应该查看播放地址是否为静态数据
明显看出数据并不是静态数据,在区分是否为动态数据,通过抓包工具进行获取。
也并不是动态数据,媒体数据也不知道怎么形成的。
从头再来从前端页面在进行解析,找视频页面的事件。
并没有发现有效数据,但是在iframe下面的Script标签有js跳转地址 ,解析的数据网址和视频的播放地址是一样的域名, 点击查看, 这不是就是我们找的视频播放地址嘛 ,终于找到了,开始实现 在当前页面通过xpath方式提取出script里的js跳转地址, 拼接出新的视频链接播放地址,发送请求,通过正则表达式提取出所有MP4播放地址。
new_url = http://www.imomoe.la + chapter_url_list
response = requests.get(new_url, headers=headers)
html = etree.HTML(response.content.decode(gbk))
data_url = http://www.imomoe.la + html.xpath(//div[@class=player]/script[1]/@src)[0]
res = requests.get(data_url, headers=headers).text
# print(res)
play_url_list = re.findall(\$(.*?)\$flv, res)
print(play_url_list)保存对视频数据发送请求,保存数据到mp4 ,通过tqdm工具能查看对应下载的速度以及下载的进度
for chapter, play_url in tqdm(zip(chapter_list, play_url_list)):
result = requests.get(play_url, headers=headers).content
f = open(终末的女武神/ + chapter + .mp4, wb)
f.write(result)到这大功告成 但是当我把网址修改成斗破苍穹这个动漫时,却返回的数据为空 这个视频的加载数据的规则是不一样的加载的数据为m3u8的格式, 其他的音频的数据加载可能也不一样, 处理m3u8的数据稍稍的有丢丢复杂,它的m3u8的文件内部有嵌套了m3u8链接地址, 需要转换对应的数据接口,进行链接地址拼接, 取出ts文件进行下载,拼接成视频。
m3u8_url_list = re.findall(\$(.*?)\$bdhd, res)
for m3u8_url, chapter in zip(m3u8_url_list, chapter_list):
data = requests.get(m3u8_url, headers=headers)
# print(data.text)
new_m3u8_url = https://cdn.-zy.com/ + re.findall(/(.*?m3u8), data.text)[0]
# print(new_m3u8_url)
ts_data = requests.get(new_m3u8_url, headers=headers)
ts_url_list = re.findall(/(.*?ts), ts_data.text)
print(正在下载:, chapter)
for ts_url in tqdm(ts_url_list):
result = requests.get(https://cdn.-zy.com/ + ts_url).content
f = open(斗破苍穹/ + chapter + .mp4, ab)
f.write(result)项目思路总结
- 获取到想要动漫的地址
- 提取详情页面的名字已经跳转地址
- 获取页面的静态js文件
- 解析视频播放地址或者m3u8文件
- 保存对应数据
简易源码分享
import requests
from lxml import etree
import re
from tqdm import tqdm
headers = {
User-Agent: Mozilla/ (Windows NT ; Win64; x64) AppleWebKit/ (KHTML, like Gecko) Chrome/ Safari/,
Referer: http://www.imomoe.la/search.asp
}
url = http://www.imomoe.la/view/.html
response = requests.get(url, headers=headers)
# print(response.content.decode(gbk))
html_data = etree.HTML(response.content.decode(gbk))
chapter_list = html_data.xpath(//div[@class=movurl]/ul/li/a/text())
chapter_url_list = html_data.xpath(//div[@class=movurl]/ul/li/a/@href)[0]
# print(chapter_list)
# print(chapter_url_list)
new_url = http://www.imomoe.la + chapter_url_list
response = requests.get(new_url, headers=headers)
html = etree.HTML(response.content.decode(gbk))
data_url = http://www.imomoe.la + html.xpath(//div[@class=player]/script[1]/@src)[0]
res = requests.get(data_url, headers=headers).text
# print(res)
play_url_list = re.findall(\$(.*?)\$flv, res)
print(play_url_list)
for chapter, play_url in tqdm(zip(chapter_list, play_url_list)):
result = requests.get(play_url, headers=headers).content
f = open(终末的女武神/ + chapter + .mp4, wb)
f.write(result)
发现不会的或者学习Python的,可以直接评论留言或者私我【非常感谢你的点赞、收藏、关注、评论,一键四连支持】
最后,小编想说:我是一名python开发工程师,整理了一套最新的python系统学习教程,想要这些资料的可以关注私信小编“”即可(免费分享哦)希望能对你有所帮助.
相关推荐
- 我的抗战演员表全部_我的抗战演员表全部名单
-
霍啸林,是抗战剧勇敢的抗战中的角色。由男演员杨志刚饰演。他曾经是一个不学无术的少爷。后来在父亲霍绍昌被赵金虎杀后才懂得的世间的冷暖。后来选择了抗日救国,最后被日本侵略者砍下脑袋。勇者的抗战霍啸林大结局...
- 虐到肝疼的超级虐文短篇现代言情
-
《送你一枝野百合》作者:罪加罪从校园到都市,双向暗恋,女追男+追妻火葬场,这本真的绝,甜虐交织,推拉一绝,今年看过的最好看的文。罪加罪真的好厉害,讲故事的能力很强。作者罪加罪真的好厉害,又会写甜,又会...
- 海洋天堂观后感_海洋天堂观后感一千字
-
海洋天堂结局:是大福像从前趴在父亲背上一样,伏在海龟的身上,和他一起游。他费尽心力地教大福自己坐公交车去海洋馆,在海洋馆擦地。为了不让大福感到孤独,他不惜拖着病重的身体,背着自制的龟壳扮成海龟,陪着大...
- 无敌战神林北_无敌战神林北1130
-
五年前,被陷害入狱!五年后,他荣耀归来,天下权势,尽握手中!我所失去的,终会千百倍的拿回来! 此一刻,天空之城,整个议事大厅,鸦雀无声…&nb...
- 虫儿飞原唱_虫儿飞原唱郑伊健
-
原唱郑伊健主唱,童声伴唱歌曲歌词:黑黑的天空低垂,亮亮的繁星相随,虫儿飞,虫儿飞,你在思念谁。天上的星星流泪,地上的玫瑰枯萎,冷风吹,冷风吹,只要有你陪,虫儿飞花儿睡,一双又一对才美,不怕天黑,只怕心...
- 黑莓视频_黑莓视频素材
-
看视频没问题!只是他是四方屏幕,不能满屏观看,而且屏幕又小!这个黑莓打电话发信息上上网还是可以的。看视频就一般般啦!
- 最霸气的十首诗_笛子最霸气的十首诗
-
一生必读的十首霸气古诗词有:《观沧海》、《赤壁》、《过零丁洋》、《夏日绝句》、《石灰吟》、《满江红》、《赴戍登程口占示家人·其二》、《从军行》、《雁门太守行》和《无题·龙卧千江水自流》。这些诗词或表达...
- 你是我藏不住的甜_你是我藏不住的甜最新章节
-
第五十四章!小说甜而不腻,有些接地气,作者文笔流畅,句句写进人心,情节套路新颖,不是烂大街的剧情,在读的时候,最大的体验就是感觉书里出现的那些人好像我们身边也有。《偷偷藏不住》刚开始看到书名的时候,我...
- 神级奶爸免费阅读全文_神级奶爸格格党
-
尚不清楚。因为张汉是一个虚构角色,他的结局取决于他的作者和故事情节的发展。如果现有的小说或影视作品已经完成,那么可以据此判断他的结局;如果还有未完成的作品,那么他的结局还不确定。需要等待后续的剧情发展...
- 哆啦a梦主题曲歌词_哆啦a梦主题曲歌词罗马音
-
1:“?”是的,我给你讲一下哆啦A梦主题曲的国语版歌词。1,哆啦A梦主题曲的国语版歌词是这样的:小小的希望被星星守护夜空之下未来是创造这世界的奇迹用画笔绘出期待与创意将...
- 十大最强机械怪兽_十大最强机械怪兽实力排行
-
金谷桥,艾雷王,艾斯杀手,机械哥莫拉,我现在只想起来这些1嘎拉蒙不是机器怪兽。2嘎拉蒙是一个虚构的角色,不是真实存在的机器怪兽。他是一只来自外太空的生物,具有超能力和变形能力。3嘎拉蒙在动画片和...
- 绝密押运40集免费观看_电视剧绝密押运全集
-
是假象的卧底,其实都是蝴蝶帮干的,武警没有卧底只是赵野是警察安在银行的卧底而已私家车恶意插队是在第二集。绝密押运第二集剧情:陶涛到九中队报到,被分配到警卫连。九中队军容整齐,军纪严明,营区内布满...
- 海之边夜未增减板全季_海之边境
-
大海是有边的。虽然说大海看起来无边无际,但它总是有尽头的。太平洋是最宽广的,但它的东边是美洲,西边是亚洲,北边是白领海峡,南边一直到南极洲,它也是有头的。其他有印度洋,北冰洋,大西洋,它们也都是有尽头...
- 夏至桑旗全文免费阅读_夏至桑旗免费阅读目录
-
《初婚有错》女主夏至,男主桑棋。作者芭了芭蕉。简介:年轻貌美的女记者忽然怀孕了,孩子不是老公的。当做金丝鸟被圈养,却不知道对方是谁;有一天晚上,一个人爬上了她的床,“怎么是你”桑旗开了一家绣坊,夏至辞...
- 权力的游戏第7集完整版_权力的游戏第1集完整版
-
1、史塔克家族的北境王国2、霍尔家族的河屿王国(河间地+铁群岛)3、艾林家族的山谷王国4、杜兰登家族的风暴地风暴王国5、兰尼斯特家族的西镜凯岩王国6、园丁家族的河湾地河湾王国7、纳梅洛斯·马泰尔家族的...
- 一周热门
- 最近发表
- 标签列表
-
