Python爬虫爬取酷狗音乐的源码怎么编写
今天就跟大家聊聊有关Python爬虫爬取酷狗音乐的源码怎么编写,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。
创新互联服务项目包括砚山网站建设、砚山网站制作、砚山网页制作以及砚山网络营销策划等。多年来,我们专注于互联网行业,利用自身积累的技术优势、行业经验、深度合作伙伴关系等,向广大中小型企业、政府机构等提供互联网行业的解决方案,砚山网站推广取得了明显的社会效益与经济效益。目前,我们服务的客户以成都为中心已经辐射到砚山省份的部分城市,未来相信会继续扩大服务区域并继续获得客户的支持与信任!
在常见的几个音乐网站里,酷狗可以说是最好爬取的啦,什么弯都没有,也没加密啥的,所以最适合小白入门爬虫
项目源码
import requests
from selenium import webdriver
from pyquery import PyQuery as pq
#获取歌名
def Access_to_the_song(C):
doc=pq(C)
The_song=doc('.audioName').text()
return The_song
#进入听歌的界面爬取HTML
def Browser_access(URL):
The_browser=webdriver.ChromeOptions()
The_browser.set_headless()
Drier=webdriver.Chrome(options=The_browser)
Drier.get(URL)
Print_source=Drier.page_source
doc = pq(Print_source)
Music_links = doc('.music').items()
for i in Music_links:
Music_downloads = i.attr('src')
with open(Access_to_the_song(Print_source) + '.mp3', 'wb')as p:
p.write(requests.get(Music_downloads).content)
#爬取热门歌曲
def Music_links():
URL = 'http://www.kugou.com/yy/rank/home/1-6666.html?from=rank'
headers={
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
}
response = requests.get(URL,headers=headers).text
doc = pq(response)
test = doc('.pc_temp_songname').items()
for i in test:
c = i.attr('href')
Browser_access(c)
Music_links()
看完上述内容,你们对Python爬虫爬取酷狗音乐的源码怎么编写有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注创新互联行业资讯频道,感谢大家的支持。
网页标题:Python爬虫爬取酷狗音乐的源码怎么编写
网页路径:http://azwzsj.com/article/pgjpoh.html