空気読む!10年間、36億記事のブログから分かったこと
[紹介論文] Y. Sano, H. Takayasu, S. Havlin and M. Takayasu (2019) Identifying long-term periodic cycles and memories of collective emotion in online social media. PLoS ONE 14(3): e0213843.
[論文URL] https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0213843
東日本大震災後の自粛ムード、慶事の祝賀ムードなど、世の中の「空気感」(集合的な感情、collective emotionと本文では呼びます)は、実体経済にも大きく影響するにもかかわらず、それを捉えることは極めて困難です。また、正解データもないためその妥当性の評価も困難です。本研究では、この問題に対し10年間の約36億記事のブログデータを用い、なるべく簡単な手法で、答えの1つを提供します。
背景
近年、TwitterやFacebookなど個人が自由に書き込みができるソーシャルメディアの書き込みを集め、ぼんやりとみんなの感じている、空気感や幸福感を抽出する研究が可能になりました。さらに、より具体的に、疲れや落ち込みなどの感情も抽出し、日照時間など実世界との比較をする研究も増えています。しかし、感情の持つ季節や曜日の周期性、特に感情の持つ長期記憶に関しては、データが不足していることもあり、あまり注目されてきませんでした。例えば、TwitterやFacebookが本格的に日本上陸したのは2008年です。それに対してブログは2006年頃から安定して存在しています。
データと手法
われわれは10年間(2006年から2016年)に日本語で投稿されたブログ約36億記事から、スパムを除いた後、POMS(Profile Of Mood State)に基づく独自の辞書を構築し、以下の6感情の日次の変動を抽出しました。なお辞書とデータはAppendixで公開しています。
- 緊張ー不安(Tension-Anxiety)|「ソワソワ」「気掛かり」など
- 抑うつー落ち込み(Depression-Dejection)|「がっかり」「惨め」など
- 怒りー敵意(Anger-Hostility)|「イライラする」「憤慨」など
- 活気(Vigor)|「元気いっぱい」「活動的」など
- 疲労(Fatigue)|「グッタリ」「へとへと」など
- 混乱(Confusion)|「呆然」「グダグダ」など
結果
感情は急激に変化するのではなく、緩やかに変動を続けており、その変動には季節や曜日の周期性、さらに数ヶ月スケールの長期記憶が内在していることが明らかになりました。
ただし、地震や台風などの自然災害では、主に緊張の感情がパルス的に立ち上がり、数日以内に元に戻ります。唯一、東日本大地震だけは、緊張、抑うつ、混乱が約1カ月続きました。
以下は詳細な結果です。
曜日の周期
月曜に増える感情は、抑うつと疲労です。これは月曜の憂鬱な気分や、週末の疲れが残っていることが示唆されます。金曜には緊張が増えますが、これは週末の天気を心配している場合が多いようです。週末には極端に、怒りや緊張が減少しており、多くの人がリラックスして過ごしているようです。
季節の周期
春に増える感情は緊張です。特に4/5-7に毎年集中していることから、入学式などの新学期の始まりに多くの人が緊張しているようです。夏に増える感情は疲労です。日本の暑い夏、夏休み中のお出かけなどで疲れていることが考えられます。なお、疲れはゴールデンウィーク明け、お盆休みや正月休み明けなど連休明けにも増える傾向があります。冬、特に1月には抑うつと混乱がわずかに増える傾向があります。これは先行研究でも指摘されている通り、日照時間と関連していることが考えられます。
(小ネタ)日米の差
バレンタイン、大晦日はアメリカでは幸福感が高い日ですが、日本の場合は違いました。日本ではバレンタインは緊張、大晦日は抑うつと混乱が増えるという結果となりました。感情の周期性には文化や国民性の違いも埋め込まれているようです。
長期記憶
みんながバラバラに書き込みを行なっているデータを集めて感情を定義しているので、時間相関は無いことが予想されるのですが、実際は自己相関関数が指数が-0.5程度のべき関数的に減衰し、数ヶ月のオーダーで長期記憶を持つことが明らかにかりました。これは、自己相関関数や主成分分析の結果を、ランダムシャッフルしたデータと比較することでも確認しました。(本文のFig.4と5に詳細) すなわち、空気感は突然変わるというよりは、緩やかに変動しており、今回はその証拠を掴んだことになります。
まとめと展望
空気感は直接観測することはできません。しかし今回の結果から、空気感の一側面を観測することができたと思います。空気感には周期性があり、記憶を持ちながら緩やかに変動することを量的に示すことができました。今後は感情間のつながり(例えば、疲れの次にはどんな感情が増えるのか)の分析や、POMS以外の感情定義などにトライし、研究を蓄積していきたいと思っています。
謝辞
本研究は株式会社ホットリンクよりデータの提供を受けています。また感情辞書の構築にも、ホットリンク社にご協力いただきました。
Personal Backyard
この研究は2014年春に物理学会で発表してから、初稿は2016年春にできて(出産した日の朝!)、投稿したのが2018年夏という、非常に長い時間をかけて形にすることとなりました。間に、職場が変わったり、子どもが生まれたりとライフイベントを挟み、限られた時間の中、共同研究者やホットリンク社に何度も助けてもらいました。2017年にはイスラエルのBar-Ilan大のHavlin氏も加わり、全体の再構築をしました。Havlin氏は論文の総引用数が7万を超える、物理では著名な研究者です。大御所なので議論中心なのかと思いきや、氏は原稿の細部(カンマの位置まで!)まで丁寧に手を入れ、アクセプトされた時は、本当に喜んでくれました。そういう研究に対する態度から学ぶところも非常に大きかったです。これからも氏と共同研究は続けられることは、とても幸運なことです。