テキストマイニングによるTwitter個人アカウントの性格推定

By Jumpei Yoshimura

Elevator Pitch

「あなたこともっとよく知りたいの…」こんな酔狂な願いもPythonなら叶えてくれます。requests, gensim, scikit-learnなどPythonのライブラリを利用してTwitter個人アカウントの性格推定を試みます。

Description

テキストマイニングによるTwitter個人アカウントの性格推定

  • ツイートの収集(requests)
  • 文書分類器の作成
    • 形態素解析(mecab-python3)
    • 特徴ベクトルの作成(gensim)
    • ツイートと性格ラベルの学習(scikit-learn)

Notes

エゴグラムという性格診断手法があり、その特徴量をもつアカウントがTwitterには数多く存在します。そのTwitterアカウントのツイートと特徴量を正解データとし学習させ、性格不明のTwitterアカウントをツイートから推定します。その過程と結果を紹介します。時間が許せば、Webアプリケーションを作成し公開したいと思っています。