ホーム » 社情の日常 » 話題の可視化(2)

話題の可視化(2)

以前、「話題の可視化」というタイトルで、Twitterのトレンドワードをグラフにするという話を紹介しました。今回は、毎日たくさん現れては消えるトレンドワードそのものを図示することで、その日とくに話題に上っていたトピックは何かをひと目でわかるようにしようという試みです。

1月26日のトレンドワードマップ

この図は、2019年1月26日に収集したTwitterのトレンドワード群を、ある法則に従ってグラフ化したものです。個々のトレンドワードには「話題の可視化」で紹介したグラフが紐付けられているので、そこに出てくるワードとその出現確率で多次元空間を作ることができます。その空間においてコサイン類似度(多次元空間における類似度指標のひとつ)を計算し、一定のしきい値を超えたワード、すなわち似たような内容の話をしているもの同士を線でつないでいます。線の上に記されている数字は、コサイン類似度の値です。1.0に近いほど、両端のワードは似ている、ということになります。また、2つ以上のトレンドワードが関連するものとして判定された場合については、それぞれに色を付けて目立たせるようにしてあります。

この日は全豪オープンで大坂なおみ選手が優勝したという出来事がありました。この図でみると、中心部分の水色で示された話題がそれに関連したトピックだということが分かります。この日、いちばん大きな話題だったということも分かりますね。

1月27日のトレンドマップ

次の図は、翌日、1月27日の図です。この日は「人気グループの嵐が2020年をもって活動停止する」というスクープが話題になりました。中心部分の塊は、その話題に関連したものだということが分かります。

このように、Twitterのデータから世間の流行をひと目で分かるようにするという試み、なかなか面白いものだと思いませんか?社会情報学専攻では、こんな研究も行っています。