0494名無しさん@お腹いっぱい。 (ワッチョイ df01-7W5u)
2021/05/04(火) 10:10:46.92ID:SZJdnx8G0あと指標が多すぎてわかりにくかっただろうから一つに絞った
・リーカーの2/12〜5/2の80日間の書き込み時間
・当該期間中にツイートがあるにじさんじ所属ライバー100人の2/12〜5/2のツイート時間
これらを用いてリーカーとライバーの活動時間の類似度を求めた
類似度の指標としてはJaccard係数を使用した
1日を1時間ごとに24分割してその1つ1つをピリオドと呼ぶ
Jaccard係数は(リーカーの書き込みとツイートが両方存在するピリオドの総数)/(リーカーの書き込みとツイートの少なくとも片方が存在するピリオドの総数)で求められる
Jaccard係数の計算の例
リーカーが2時、3時に書き込みをしている場合
ツイートが2時、3時→Jaccard=2/2=1
ツイートが0時、1時、2時→Jaccard=1/4=0.25
ツイートが9時、10時→Jaccard=0/4=0
また、ツイートしているピリオド数が多ければ類似度も高くなりやすいことを考慮し「同じピリオド数でランダムにツイートをした場合のJaccard係数の期待値」を求め、その値と実際の値との乖離を求めた
表のE(Jaccard)はJaccardの期待値、ΔJaccard=Jaccard-E(Jaccard)は実際の値と期待値の差である
https://i.imgur.com/PMAyVeE.jpg
多くのライバーのΔJaccardが正となっているが、リーカーもライバーも人間である以上は明け方に活動が減ったり夜に活動が増えたりするという傾向があるため、完全なランダムよりも類似度が高くなりやすいと考えられる