python对音乐排行爬取

对于我们想要爬取的东西,作为我们爬取人员一定要心里有数,为何而怕,请三思后而行动。

做一件事,我们一定要知道为什么去做?那为什么要用Python进行网络爬虫呢?
原因:其实简单的对信息的下载,我们用不到爬虫得出马,简单的一个单机下载,就可以解决下载的问题,但是对于想要多个音乐(排行榜里),有一定规律的音乐进行下载我们就可以看到Python给我们带来的便利,其实也是一种对数据进行搜集的一种方式。
希望通过简单的音乐排名的爬取可以让我们更加了解python,并且对音乐数据背后带来的信息进行分析。

一、首先明确我们的目标

我们是想干什么,就像我写这篇文章的时候想和大家分享什么一样,我想要向大家分析的就是爬取音乐的热度,排行并探索背后的信息。明确我们的目标以后,我们就开始找能让我们进行音乐排名爬取的网站(主要是这个网站里有我们想要的、能用的信息)。

工作开始啦!!!

requests 爬虫 听歌 网络爬虫爬取音乐_python


对于音乐爬取,这个不涉及到版权的问题,爬取上应该没有太多的限制,那我们要找的就是最区有权威的网站 进行爬取学习,分析。我这里找的是网易云(不要问为啥,问就是(❤ ω ❤))

我们来打开网易云,为我们提供的数据排行

requests 爬虫 听歌 网络爬虫爬取音乐_网易云_02

我们看到我们想要的数据对应的排行了,这样我们对于我们的目标就有近了一步。

二、分析来自目标给我们的代码.

这里,我想首先源代码与渲染之后的代码进行查看(可以看我的,相关文档(我还没有去写,嘻嘻。。稍后我就专门写一个两者的区别,对于代码的选择有很大的作用哦)),在这里我们就先知道我们通过python爬取的一般是源代码。

这个网站的源代码如下:

requests 爬虫 听歌 网络爬虫爬取音乐_网易云_03


下面的是渲染过的代码,通过开发者工具打开的代码:

requests 爬虫 听歌 网络爬虫爬取音乐_大数据_04


一样的话对我们爬取我们就可以,充分利用到开发者工具了,这里显然看着应该是一样的,但是后面的数据呢?这给答案交给你。

点击对应的数据表格,在标签中开始使用正则进行检索了