統計ソフトSPSSでVtuberの散布図を作ってみた

こんにちは、銀ふくろうです。
大学で統計ソフトのSPSSを使って散布図を作成する授業がありました。
せっかくなので何かに使ってみようということでチャンネル登録者上から30位までの人気Vtuberで散布図を作ってみることにしました。
今回の結果を利用した配信者への中傷は絶対にしないでください。

散布図と言ったって縦軸と横軸に何を取るのか、というのは最初の段階では分かりません。
ソフトに作ってもらいます。手順としては、

①それぞれのVtuberの登録者数、総再生数、配信開始日、新規登録数(1日当たり)を数字データとして、主な使用言語と所属事務所を文字データとして記入します。
(当初は動画再生数推移も入れる予定でしたが再生数不明の動画が幾つか投稿されているため断念しました。)

これは1月時点のもの。3月時点でだいぶ変化していた。なおマイナス推移は0として表記される。

ちなみにこれらの情報は「Vtuberランキング」のファン数ランキングページ(https://virtual-youtuber.userlocal.jp/document/ranking)からお借りしました。

②続いて数字データーを元に成分分析をソフトにしてもらいます。出してもらう成分はそのまま散布図の軸になるので、ここでは2種類に固定していおきました。
とはいえ出してもらったままの成分には「〇〇の大小」みたいな名前はついていません。それぞれの数字データとの相関係数を元に人間が「この成分は〇〇の事を言っていそうだ」と判断し、成分の名前をつけます。実際には以下のようになりました。

ぶっちゃけこれらの要素から抽出されるデータなんて大体予想できる。

成分1は登録者数や総再生数について強い正の相関が、初回配信日と登録追加数についてはやや強い負の相関が見られます。一方で成分2は登録者数と初回配信日にやや弱い正の相関がある一方で、総再生数とはほとんど相関が見られず新規登録数に強い相関が見られました。

これらの事から成分1を「定番性」、成分2を「流行性」と呼ぶことにします。
で2つの成分を元に散布図をソフトに作成させてみました。

sささいさいsさいsyさいしょ

キズナアイさんがある意味強すぎるということでキズナアイさん以外でも成分抽出・散布図作成を試してみます。あのダウンタウンさんと共演していましたもんね。知名度は抜群でしょう。

前のとはかなり異なった数字が出てきた。
が、成分として予測されることは余り変わらないような気がする。

このデータ群との相関係数から成分1を「話題席巻性」、成分2を「ライト性」と呼ぶことにします。成分1の名前の由来は新規流行性に加えて登録者数に強い相関が見られたためで、2を「定番性」としなかったのは登録者数との相関係数の絶対値が小さかったためです。

まあ視聴者にはある程度予想がついていた事かもしれませんがVtuber業界では新規配信者が登録者獲得の面で有利な傾向にあるのかもしれませんね。

ではまた散布図を作成してみます。

前の散布図と大体一緒。

個人的にはホロライブのEN組が総じてもっと右に伸びると思っていたので少し意外でした。
というのも1月時点のデータで新規登録数を除いて作成した散布図した時はEN組が一番右で塊になっていたからです。ちなみにその散布図は以下の通りです。それと配信している動画の幾つかからして「ライト…?」と首をかしげるようなライト性が高いとされる配信者も居て成分分析を間違えたなあと思ってしまう所もありますね。

他にも赤井はあとさんのポジションが大きく変化している。
個人的にも「はあちゃま」と「はあと」の関係性について、今後も見逃せない。

ただ忘れてはいけないのは、これは「最も登録者の多いVtuber30チャンネル」について扱ったものだということです。更に新規登録者の対象期間がかなり短い期間(詳細は不明ですが少なくとも2週間よりは短い期間での増減数から推計されているように思えます)で推計されているため、その値が大きいからと言ってすぐに今話題の配信者!とは言えないのも確かであると思います。

何れにしても配信者の如何について絶対の指標を示すものではありません。
この記事とセットで配信者を中傷する事は絶対にしないでください。

最後までご覧いただきありがとうございました。

コメント

タイトルとURLをコピーしました