Selenium实现付费音乐批量下载

必备环境
废话每年回家都要帮我爸下些音乐，这对我来说都是轻车熟路！可当我打开网易云点击下载按钮的时候，可惜已物是人非啦！
开个 VIP 其实也不贵，临时用用也就￥15！但 IT 男的尊严必须要有，于是开始徜徉于搜索引擎中
最后在知乎中，搜索到一个网址 VIP付费音乐解析
P.S.再次感谢提供该服务的作者！如果你下载的音乐数量不多，直接这里搜索下载，下载后修改文件名即可！并且在这个网址中点击播放列表-点击同步，可以同步网易云的歌单！之后批量下载即是下载这些网易云的歌单！但是下载某个歌单中的几百首歌，手动下载就不现实了！在点击同步中需要输入你的网易云 UID，这 UID 的获取方式如下：第一步打开网易云随便选中一首歌，右键复制链接
然后随便找个地方粘贴这个链接，例如https://music.163.com/song?id=25727803&userid=275613591最后这串数字就是 UID！
程序运行环境第一步安装一个python3，这个简单吧！贴上我的版本 python3.65，安装时注意勾选Add in path
第二步下载FFmpeg，这是用来解析视频和音频的，作为you-get的辅助工具，下载点这里，下载后解压添加环境变量即可
第三步安装you-get，这是个下载视频音频的神器，有兴趣可以深入研究！之后我打算写个下载任意视频的工具，嘿嘿这是后话了！安装方式很简单pip install you-get
环境配置就这样，还是非常轻松的，下面会解释下代码
源码
完整代码
from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
import time, os
# import threding

def get_music_name_link():
main_handle = browser.current_window_handle
fp = open(‘E:\\Project_PY\\file\\musiclink.txt’,’wb’)
fp2 = open(‘E:\\Project_PY\\file\\musicname.txt’,’wb’)
try:
for i in list(range(2,400)):
browser.switch_to_window(main_handle)
txt = browser.find_element_by_xpath(‘/html/body/div[3]/div/div[2]/div[2]/div[1]/div/div[%d]’ % i).text + ‘\n’
fp2.write(bytes(txt,encoding=’utf-8′))
location = browser.find_element_by_xpath(‘/html/body/div[3]/div/div[2]/div[2]/div[1]/div/div[%d]’ % i)
ActionChains(browser).move_to_element(location).perform()
browser.find_element_by_xpath(‘/html/body/div[3]/div/div[2]/div[2]/div[1]/div/div[%d]/span[5]/div/span[2]’ % i).click()
time.sleep(2)
all_handles = browser.window_handles
browser.switch_to_window(all_handles[-1]) # lastest
url_link = browser.current_url + ‘\n’
fp.write(bytes(url_link,encoding=’utf-8′))
browser.close()
except Exception as e:
print(‘get_music_name_link meet some problem! {}’.format(e))
fp.close()
fp2.close()

def download_music(list_name):
with open(‘E:\\Project_PY\\file\\musicname.txt’,’r’,encoding=’utf-8′) as fp1:
music_name = fp1.readlines()
len1 = len(music_name)
fp2 = open(‘E:\\Project_PY\\file\\musicname_format.txt’,’w’,encoding=’utf-8′)
for i in range(3,len1,4):
music_name_format = music_name[i].strip() + ‘\n’
fp2.write(music_name_format)
fp2.close()

with open(‘E:\\Project_PY\\file\\musiclink.txt’,’r’,encoding=’utf-8′) as fp1:
with open(‘E:\\Project_PY\\file\\musicname_format.txt’,’r’,encoding=’utf-8′) as fp2:
for music_link,music_name in zip(fp1.readlines(),fp2.readlines()):
you_get_link = ‘you-get “{}” -o “E:\\Project_PY\\file\\music\\{}” -O “{}”‘.format(music_link.strip(),list_name,music_name.strip())
you_get_link = you_get_link.strip()
# print(you_get_link)
os.system(you_get_link)

url = ‘http://music.zhuolin.wang/’
uid = input(‘please input your uid:’)
options = webdriver.FirefoxOptions()
options.add_argument(‘–headless’)
browser = webdriver.Firefox(firefox_options=options)
browser.implicitly_wait(8)
browser.get(url)
# browser.maximize_window()
browser.set_window_size(1000,100000)
browser.find_element_by_xpath(‘/html/body/div[3]/div/div[1]/div/span[3]’).click()
# scroll = browser.find_element_by_xpath(‘//*[@id=”mCSB_1_dragger_vertical”]’)
# ActionChains(browser).drag_and_drop_by_offset(scroll,0,100).perform()
# time.sleep(2)
all_handles = browser.window_handles
browser.switch_to_window(all_handles[-1]) # lastest
time.sleep(1)
browser.find_element_by_xpath(‘/html/body/div[3]/div/div[2]/div[1]/div[1]/div/span/div[2]/span’).click()
all_handles = browser.window_handles
browser.switch_to_window(all_handles[-1]) # lastest
time.sleep(1)
browser.find_element_by_xpath(‘/html/body/div[6]/div[2]/input’).send_keys(uid)
browser.find_element_by_xpath(‘/html/body/div[6]/div[3]/a[1]’).click()
# t1 = threading.Thread(target=get_music_name)
# t2 = threading.Thread(target=get_music_link)
# t3 = threading.Thread(target=download_music)

for i in list(range(3,100)):
try:
print(‘downloading song_list{}! please waiting….’.format(i))
browser.find_element_by_xpath(‘/html/body/div[3]/div/div[2]/div[1]/div[1]/div/div[%d]/img’ % i).click()
dir_name = browser.find_element_by_xpath(‘/html/body/div[3]/div/div[2]/div[1]/div[1]/div/div[%d]/p’ % i).text
time.sleep(1)
get_music_name_link()
download_music(dir_name)
browser.find_element_by_xpath(‘/html/body/div[3]/div/div[1]/div/span[3]’).click()
time.sleep(1)
all_handles = browser.window_handles
browser.switch_to_window(all_handles[-1]) # lastest
time.sleep(5)
except Exception as e:
print(‘get_song_list meet some problem! {}’.format(e))
browser.quit()
核心代码解释总共有三个函数：函数一get_music_name_link，主要是获取音乐名称以及音乐的下载链接函数二download_music，获取歌单名称，然后拼接下载链接和音乐名，调用you-get开始下载到对应目录函数三main，主要是利用 UID 获取歌单，以及批量下载歌单中的曲目
需要注意的几个点：1.使用了sleep(1)休眠一秒，如果网络较慢需要将所有的sleep休眠时间加长2.所有的路径需要自己根据本机修改3.如果要修改代码一定要注意switch_to_window来切换窗口4.73行的for i in list(range(3,100))是用来选择下载的歌单，歌单从 1 开始计数
程序演示输入网易云的 UID！
然后静静的等待即可…此过程中会有部分音乐的播放声音，不喜欢可以开静音下
当所有的链接解析完成后就会调用you-get下载，此过程会自动创建与歌单名相同的文件夹
下载完成后
P.S.如果要下载所有歌单，就不需要修改代码，直接输入网易云的 UID 运行即可！如果要下载某个具体的歌单只需要改动73行的这个循环for i in list(range(3,100))，所以说程序还是比较简单的，缺点可能就是没时间写 UI，而且也不太会 pyqt 之类的，只会点 MFC！所以将就用吧，功能还是很齐全的！
END

Selenium实现付费音乐批量下载

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

Selenium实现付费音乐批量下载

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复