データを可視化することで見える世界はここにあります!
このエッセイでは、なろうのWeb APIからこのサイトの小説データを取得してガラフなどで可視化したり統計的考察を実行したりします。
なろうには色んな作品が投稿されていますが、ここでは主に『TS』というジャンルにフォーカスします。
最近私は主にTSものを読んでいて、作品の紹介とまとめを書いています。もう一つのエッセイに乗ってあります。
>> https://ncode.syosetu.com/n6126gu/
あっちのエッセイでは読んだ全部のTS作品を紹介していますが、それはほんの僅か一部に過ぎません。
それに対しこっちのエッセイはこの『小説家になろう』全体のTS作品を持ち出して一気に分析します。
感覚だけではなく、作品について数字と画像で評価して納得させるのです。
※ 内容:
- なろうによるTS作品の位置づけ
- 統計や機械学習で傾向の分析と予測
- どんな作品は人気? 名作はどれ?(色んな意味で)
- ブクマ、評価、ポイント、感想、レビューの傾向
- ジャンル別や関係のあるキーワードとの関係
- 作品タイトルや1話のサブタイトルの大切さ
- 1話の文字数や更新頻度
- TS作品の作者はどんな人?
- このあらすじは長すぎない? こんなに長く書く必要があるの?
など
使ったデータは2022年1月1日時点でAPIから取得したものです。2021年末までなろうに投稿された作品データが含まれます。(検索除外や削除された作品以外)
色々プログラミングで分析します。特にPython(具体的に言うと、Pandas, Matplotlib, Scikit-learnなど)
ここで主に結果だけ載せて、詳しい方法は割愛しますが、プログラミングやデータサイエンスに興味があったら感想でお尋ね大歓迎です。
このエッセイは、TS好きはもちろん、『小説家になろう』のことをもっと知りたい人やデータ分析に興味ある人も是非おすすめです。