如何用Python爬取喜马拉雅全网音频文件

如何用Python爬取喜马拉雅全网音频文件

什么是喜马拉雅

喜马拉雅FM是国内分享平台,3月手机客户端上线,两年多时间手机用户规模已突破2亿 [1] ,成为国内发展最快、规模最大的在线移动音频分享平台。

如何用Python爬取喜马拉雅全网音频文件

今天小编分享爬取喜马拉雅的单本全集的音频文件和全网站的音频

环境配置:

Windows + Python 3.6

import json

import re

import requests

import re

import requests

from lxml import etree

from onexima import Xima

其实你点开网站里面的任意一个音频都会发现他们都有一个ID

如何用Python爬取喜马拉雅全网音频文件

我们需要做的就是把每一个音频的ID和整个音频的ID获取、每本书籍的名称,然后保存下载

其实思路还是很简单的。

下面是爬取一本书籍的Python代码

如何用Python爬取喜马拉雅全网音频文件

这个是爬取全站的音频的Python代码

如何用Python爬取喜马拉雅全网音频文件

关注后私信【学习资料】可以获取Python海量的学习资料

相关推荐