Python抓取歌詞自制FreeStyle！

阿新 • • 發佈：2019-01-12

故事的起因是上週六看《中國好聲音》,一個周杰倫戰隊的學員用人工智慧寫的歌詞，於是乎，我也有了這個想法，程式碼的主題思路是看Crossin先生的文章，雖然最後不能寫出一首歌，但是押韻腳這事情分分鐘搞定了

主題的思路，就是先抓取很多首歌曲的歌詞，利用jieba分詞後，將分好的詞按照押韻表進行分類，最後匹配查詢就可以了

準備一：押韻表

這個地方可以去網上搜押韻表（溫馨提示：程式碼可左右滑動）

#引用各種需要的庫
import requests
import jieba
import re
from xpinyin import Pinyin
p = Pinyin()
RhymeIndex = [('1', ['a', 'ia', 'ua']), ('2', ['ai', 'uai']), ('3', ['an', 'ian', 'uan']),
 ('4', ['ang', 'iang', 'uang']), ('5', ['ao', 'iao']), ('6', ['e', 'o', 'uo']), ('7', ['ei', 'ui']),
 ('8', ['en', 'in', 'un']), ('9', ['eng', 'ing', 'ong', 'iong']), ('10', ['er']), ('11', ['i']),
 ('12', ['ie', 'ye']), ('13', ['ou', 'iu']), ('14', ['u']), ('16', ['ue']), ('15', ['qu', 'xu', 'yu'])]
RhymeDct = {'ui': '7', 'uan': '3', 'ian': '3', 'iu': '13', 'en': '8', 'ue': '16', 'ing': '9', 'a': '1', 'ei': '7',
 'eng': '9', 'uo': '6', 'ye': '12', 'in': '8', 'ou': '13', 'ao': '5', 'uang': '4', 'ong': '9', 'ang': '4',
 'ai': '2', 'ua': '1', 'uai': '2', 'an': '3', 'iao': '5', 'ia': '1', 'ie': '12', 'iong': '9', 'i': '11',
 'er': '10', 'e': '6', 'u': '14', 'un': '8', 'iang': '4', 'o': '6', 'qu': '15', 'xu': '15', 'yu': '15'}

準備二：分詞對應押韻表編碼

分好的詞與押韻表對應起來，舉個栗子，比如“沒有”對應的是“7-13”，就等於你給每個詞都貼了一個標籤，這樣你以後想搜尋的時候，就可以根據標籤找到這些詞了

def _analysis_words(words):
 word_py =p.get_pinyin((u'{}'.format(words)))
 lst_words = word_py.split('-')
 r = []
 for i in lst_words:
 while True:
 if not i:
 break
 token = RhymeDct.get(i, None)
 if token:
 r.append(token)
 break
 i = i[1:]
 if len(r) == len(words):
 return '-'.join(r)
 #print( analysis words('兄弟'))

第一步：爬蟲抓取歌詞資訊

這個地方資料爬取的越多，肯定你的詞庫就越壯大，後面分詞也越高，我這裡只爬取了3首歌曲的歌詞，並且最後是儲存到txt中，當然，放資料庫裡就更好了

def GetKeyword():
 #歌曲列表
 # url = 'http://music.163.com/api/playlist/detail?id=808976784'
 # req = requests.get(url)
 # data = req.json()
 # print(data['result']['tracks'] )
 # tracks =data['result']['tracks'] #歌曲列表
 tracks=["431795900",'33850315','430053482']
 #寫入記事本檔案
 with open('keyword.txt','a') as f:
 f.write("[")
 for i in tracks:
 print(111)
 #歌詞
 # lrcurl = "http://music.163.com/api/song/lyric?os=pc&id="+str(i['id'])+"&lv=-1&kv=-1&tv=-1"
 lrcurl = "http://music.163.com/api/song/lyric?os=pc&id="+str(i)+"&lv=-1&kv=-1&tv=-1"
 lrcreq = requests.get(lrcurl)
 dt = lrcreq.json()
 lrc=re.sub(u"\[.*?]", "", dt['lrc']['lyric'])
 #jieba分詞
 seg_list = list(jieba.cut(lrc, cut_all=True))
 for i in seg_list:
 #加入判斷，只寫入2個字組成的詞
 if len(i)==2:
 #寫入格式：{'7-13':'追求'}
 if _analysis_words(i)!=None:
 f.write("{'"+_analysis_words(i)+"':'"+i+"'},")
 f.write("]")
 f.close()

第二步：呼叫分詞的方法

GetKeyword()

第三步：分析分詞後的txt

def Findkey(str):
 result={}
 with open('keyword.txt', 'r') as f:
 list=eval(f.readlines()[0])
 for item in list:
 if item.get(str):
 key=item.get(str)
 number=result.get(key)
 if number !=None and number>=1:
 result[key]=number+1
 else:
 result.update({key:1})
 f.close()
 print(result)

第四步：程式入口

key=input("請輸入關鍵詞:")
str=_analysis_words(key)
print("匹配押韻的詞：")
Findkey(str)

第五步：創作自己的FreeStyle

# hello 大家好，我的名字叫離島
# 沒事愛在部落格寫寫，這感覺讓我愜愜
# 寫程式碼不是男生的事，女生不是隻能做測試
# 熱愛編碼，沒有辦法
# 他們都叫我是熱愛編碼的Coding女生

進群：960410445 即可獲取數十套PDF！

Python抓取歌詞自制FreeStyle！

故事的起因是上週六看《中國好聲音》,一個周杰倫戰隊的學員用人工智慧寫的歌詞，於是乎，我也有了這個想法，程式碼的主題思路是看Crossin先生的文章，雖然最後不能寫出一首歌，但是押韻腳這事情分分鐘搞定了主題的思路，就是先抓取很多首歌曲的歌詞，利用jieba分詞後，將分好的詞按照押韻

無比強大！Python抓取cssmoban站點的模版並下載

jea blank file timeout 全局 -- 文件的 pre target Python實現抓取http://www.cssmoban.com/cssthemes站點的模版並下載實現代碼 # -*- coding: utf-8 -*- im

用Python抓取朋友圈資料，通過人臉識別全面分析好友！看透朋友圈

微信：一個提供即時通訊服務的應用程式，更是一種生活方式，超過數十億的使用者，越來越多的人選擇使用它來溝通交流。不知從何時起，我們的生活離不開微信，每天睜開眼的第一件事就是開啟微信，關注著朋友圈裡好友的動態，而朋友圈中或虛或實的狀態更新，似乎都在證明自己的“有趣”，尋找那份

用Python抓取並分析了1982場英雄聯盟資料，教你開局前預測遊戲對局勝負！

英雄聯盟想必大多數讀者不會陌生，這是一款來自拳頭，由騰訊代理的大型網路遊戲，現在一進網咖，你就能發現一大片玩英雄聯盟的人。在2017年中國戰隊無緣鳥巢的世界總決賽後，一大片人選擇了棄遊，只是終究沒躲過“真香定理”，在2018年的中旬，又有大批戰友又回到熟悉的召喚師峽谷戰場，時至今日，英雄聯盟已經不僅僅是一款遊

用Python抓取並分析了1982場英雄聯盟數據，教你開局前預測遊戲對局勝負！

cross 2018年 eva root 結果 sigmoid tcl optimizer json 英雄聯盟想必大多數讀者不會陌生，這是一款來自拳頭，由騰訊代理的大型網絡遊戲，現在一進網吧，你就能發現一大片玩英雄聯盟的人。在2017年中國戰隊無緣鳥巢的世界總決賽後，一大片

無比強大！Python抓取cssmoban網站的模版並下載

Python實現抓取http://www.cssmoban.com/cssthemes網站的模版並下載實現程式碼 # -*- coding: utf-8 -*- import urlparse import urllib2 import re import os i

Python抓取電影天堂，零基礎都可以學？原始碼&視訊，大讚！

我知道，大家肯定是看到Python原始碼&視訊教程才進來的。小編說到做到，此次利用Python爬取電影天堂包含視訊教程、以及原始碼。所以說零基礎的Python新手也能夠輕鬆學會，真的一點都不過分。先看我們的部分程式碼與爬取到的結果：爬取到的電影資源：步驟：關於怎麼快速

網易雲音樂評論催淚刷屏？我用Python抓取了1008328條熱評告訴你為什麼！

如果再過20年，你還會記得那些年上過的網易雲熱評嗎？看了那麼多的網易雲熱評，技術思維作祟，我終於

Python抓取學院新聞報告

滿足 imp 實驗源代碼 ges tail view paste rom Python案例 scrapy抓取學院新聞報告任務抓取四川大學公共管理學院官網(http://ggglxy.scu.edu.cn)所有的新聞咨詢. 實驗流程 1.確定抓取目標.2.制定抓取規則.

python抓取

info 奧巴馬 www word ref str source div term 我要抓取奧巴馬每周的演講內容http://www.putclub.com/html/radio/VOA/presidentspeech/index.html 如果手動提取，就需要一個個點進去

python抓取bing主頁背景圖片

replace utf bytes for json格式 module imp urlopen 有變最初Python2寫法： #!/usr/bin/env python # -*- coding:utf-8 -*- # -*- author:nancy -*- # pyt

Python抓取手機APP中內容

quest 手機app 開始 clas tex json 完成 keep 抓取首先下載Wireshark和模擬器（天天模擬器，夜神模擬器），天天模擬器在自帶的應用商店裏面能夠登錄微信。然後打開Wireshark選擇一個網卡開始抓包。開始抓包後，在模擬器中要抓取的APP

python 抓取cisco交換機配置文件

cal pytho quit sys led ... eof tex passwd #!/usr/bin/python import sys import time import os import pexpect now = time.strftime(‘%Y-%

用python 抓取B站視頻評論，制作詞雲

port mil query 雲圖 ges cal 爬取 close hid python 作為爬蟲利器，與其有很多強大的第三方庫是分不開的，今天說的爬取B站的視頻評論，其實重點在分析得到的評論化作嵌套的字典，在其中取出想要的內容。層層嵌套，眼花繚亂，分析時應細致！步驟分為

Python抓取數據的幾種方式

cnblogs 方式 edit api lencod nco financial 取數 .org import urllib.requestresponse = urllib.request.urlopen(‘http://python.org/‘)html = res

python 抓取電影天堂電影信息放入數據庫

python mysql 電影 # coding:utf-8 import requests from bs4 import BeautifulSoup from multiprocessing import Pool import urllib2 import re import json im

python 抓取"一個"網站文章信息放入數據庫

python 文章爬蟲 # coding:utf-8 import requests from bs4 import BeautifulSoup import json import time import datetime import pymysql import sys reload(sy

python 抓取內涵段子

爬蟲#!/usr/bin/env python #coding:utf-8 import requests,io,time from bs4 import BeautifulSoup def neihanjoke(): headers = { 'Accept':

Python抓取遠程文件獲取真實文件名

pen AR name position 遠程文件 head con get log 用urllib下載遠程文件並轉存到hdfs服務器，在下載時，下載地址中不一定包含文件名，需要從連接信息中獲取。 1 file_url = request.form.get(

python: 抓取免費代理ip

python 抓取免費代理ip通過抓取西刺網免費代理ip實現代理爬蟲： from bs4 import BeautifulSoup import requests import random import telnetlib requests = requests.session() ip_list = []

Python抓取歌詞自制FreeStyle！

相關推薦