SNSで日毎のトレンドを抽出について
概要
- SNSの公開データからトレンド情報を抽出する方法と具体例
手法
- timeseries情報を持ったSNS投稿を集める
- 今回はAPIが公開されているtwitterが対象
- すべての期間の投稿での単語の出現確率を計算する
- 日毎の投稿での単語の出現確率を計算する
2
,3
を比較して高くなっている単語がトレンドと考えられる
データ
実験結果
2022-02-22の結果
term freq prob name freq_total prob_total prob_rate
猫の日 1005 0.01005 2022-02-22 1348 0.000142126972314868 70.7114197700297
にゃんにゃん 407 0.00407 2022-02-22 650 0.0000685330356117686 59.3874175230769
ねこ 344 0.00344 2022-02-22 5427 0.000572198129638566 6.01190360788649
ネコ 279 0.00279 2022-02-22 3224 0.000339923856634372 8.20772048076923
スーパー 275 0.00275 2022-02-22 6491 0.000684381437163061 4.01822704513942
ファイトソング 229 0.00229 2022-02-22 725 0.0000764406935669726 29.9578652827586
ウマ娘 211 0.00211 2022-02-22 5480 0.00057778620792691 3.65186979379562
アクスタ 210 0.0021 2022-02-22 4842 0.000510518397587975 4.11346586121437
めめ 193 0.00193 2022-02-22 3751 0.000395488333199606 4.88004281791522
猫耳 167 0.00167 2022-02-22 312 0.0000328958570936489 50.7662711217949
猫ちゃん 159 0.00159 2022-02-22 2134 0.000224999227685406 7.06669092314902
五月雨 159 0.00159 2022-02-22 183 0.0000192946854106979 82.4061116393443
ラヴィット 157 0.00157 2022-02-22 3410 0.000359534848363278 4.36675334017595
ホリケン 144 0.00144 2022-02-22 202 0.0000212979587593496 67.6121132673267
ロシア 139 0.00139 2022-02-22 2591 0.00027318322349245 5.08816018139714
飼う 139 0.00139 2022-02-22 3595 0.000379040404652782 3.66715522392211
祝日 137 0.00137 2022-02-22 2153 0.000227002501034058 6.03517579656294
ニャン 129 0.00129 2022-02-22 1047 0.000110390905054649 11.6857453008596
人狼 127 0.00127 2022-02-22 900 0.0000948918954624488 13.3836508777778
ウクライナ 108 0.00108 2022-02-22 1954 0.000206020848592917 5.24218790174002
...
- 猫の日など最近になって流行ったトレンドを取得できている