ミスチルの歌詞をPythonで分析してみました。
分析した内容と手順は以下です。
- 歌詞をスクレイピングで収集(Beautiful Soup)
- 形態素解析をして(Janome)、単語を可視化(WordCloud)
- 歌詞で最も使われている名詞「君」と「僕」で歌詞を考察
- 「極性辞書」でネガポジ分析(最もポジティブな曲と最もネガティブな曲を自動判定)
- 「Cloud Natural Language API」で「終わりなき旅」をネガポジ分析
歌詞をスクレイピングで収集(Beautiful Soup)
PythonでWebスクレイピングを使用して、歌詞サイトからミスチルの歌詞を自動で収集しました。
全歌詞をcsvで出力するのにかかる時間は約5分ほどです。
使用したPythonのライブラリは「Beautiful Soup」です。
詳細は、下記の記事に記載しています。
ミスチルの歌詞をスクレイピングで取得してみた【Beautiful Soup】形態素解析をして(Janome)、単語を可視化(WordCloud)
歌詞を分析するために、歌詞を単語(形態素)に分割します。
この手法を「形態素解析」と言います。
形態素解析は、Pythonのライブラリ「Janome」を使用すると簡単にできます。
形態素解析を行った結果を、いい感じに可視化します。
可視化には「WordCloud」というPythonライブラリを使用します。
可視化した結果は以下です。
詳細は、下記の記事に記載しています。
ミスチルの歌詞をJanomeで解析してWordCloudで可視化してみた歌詞で最も使われている名詞「君」と「僕」で歌詞を考察
上記の形態素解析を行った結果、全歌詞の中で「君」と「僕」が最も使用されている単語であるとわかりました。
そこで、「君」と「僕」が一番使われている曲は何か、「君」と「僕」が使われている回数から歌詞の傾向が何かわからないか、ということを分析してみました。
詳細は、下記の記事に記載しています。
ミスチルで一番使われている単語は「君」と「僕」「極性辞書」でネガポジ分析
ミスチルの歌詞の中で最もポジティブな曲、最もネガティブな曲は何かを「極性辞書」を使って自動判定してみました。
極性辞書は、ある単語がポジティブな単語なのか、ネガティブな単語なのかが収録された辞書です。
日本語の極性辞書として有名なのは、以下の2つです。
- 日本語評価極性辞書(著作者: 東北大学 乾・岡崎研究室)
- 単語感情極性対応表(著作者: 東工大 高村教授)
「日本語評価極性辞書」でネガポジ分析
「日本語評価極性辞書」を使用してネガポジ分析した結果は以下に記載しています。
ミスチルの歌詞をネガポジ分析してみた【日本語評価極性辞書】ミスチルで一番ポジティブな曲とネガティブな曲は?【日本語評価極性辞書でネガポジ分析】「単語感情極性対応表」でネガポジ分析
「単語感情極性対応表」を使用してネガポジ分析した結果は以下に記載しています。
「単語感情極性対応表」 は商用利用禁止なので、個人ブログへの搭載はできません。
Qiitaに投稿しています。
「Cloud Natural Language API」で「終わりなき旅」をネガポジ分析
日本語をネガポジ分析するには極性辞書の他にGoogleのサービス「Cloud Natural Language API」を使用することでできます。
こちらは極性辞書を使用するよりもかなり簡単に分析を行うことができます。
試しに「終わりなき旅」をネガポジ分析してみました。
ミスチルの終わりなき旅をCloud Natural Language APIで感情分析してみた