前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。
今天群里面有一个小伙伴发了一个链接,出于好奇,点击去看了一下,然后确定试试看。
基本开发环境
Python 3.6
Pycharm
相关模块的使用
目标网页分析
根据小伙伴提供的地址,是关于火影博人传的。
使用开发者工具的时候发现,有现成的mp4地址,当心里面还在想着:
复制链接就自动下载了,点开一看........
怎么是这个东西,回头一看网页,原来是广告的视频 = =
再分析
1、视频获取多个ts文件
其实网站的视频数据是分为了 一个一个的TS文件,而且这些TS文件都在m3u8的链接当中。每一个ts文件链接,都是对应视频中的一个片段,整个视频就是又一个一个片段组合成。
既然知道了视频的来源,那么我们就要找到m3u8 地址的来源,并分析规律,这样才能批量爬取ts文件数据。当然如果你m3u8的url地址,也可以用一些专门的软件,可以直接下载并合成视频。
2、获取m3u8 的url地址
通过两个链接的对比,可以发现有一个日期不一样,还有一个应该就是类似ID的参数不一样,想要找到来源,可以复制 1556_fd900088 一个关键参数,在开发者工具当中搜索。
这个链接包含的参数:
根据导航栏中的url可以发现:
ID:95 对应的应该是 博人传这个动漫的ID
pid:175对应的应该就是多少集
后面两个参数的都没有传值的,复制url地址,删除后面两个参数一样可以访问,说明这个两个参数没有什么特别大的影响。
3、下载保存合并成mp4文件
先把每个ts文件都保存下来。
简单的合并成mp4文件:
电脑一般都自带安装了WinRaR解压软件,全选ts文件后右键选择添加到压缩文件,看下图界面,
注意1:压缩文件名后缀要改成.MP4,
注意2:压缩方式选择为存储,默认是标准是不行的。
注意点:
这样合并的前提是你的ts文件都是0000,然后0001 这样按照顺序排列的,不然你合并出来之后播放顺序是错乱的。
如果下载的ts文件不是这样排序的情况,需要保存整个m3u8链接中的数据。然后通过cmd命令的方式将所有的ts合并成一个文件:
copy /b d:\xxx\download_ts\*.ts d:\xxx\download_ts\new.mp4
也可以使用代码用FFmpg合并,之前爬去B站视频合并音频数据和视频画面的工具。
转载请超链接注明:头条资讯 » Python爬取网站m3u8视频,将ts解密成mp4,合并成整体视频
免责声明 :非本网注明原创的信息,皆为程序自动获取互联网,目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责;如此页面有侵犯到您的权益,请给站长发送邮件,并提供相关证明(版权证明、身份证正反面、侵权链接),站长将在收到邮件24小时内删除。