機械学習でNewsPicksのコメントをネガポジ判定してみた結果…

こんにちは、ライターのらんらんです(写真・右)。大学院で自然言語処理を使った研究をしています。

先日、AROUSAL Tech.に遊びにきたときに、NewsPicksについて佐藤さん(写真・左)と根来さんとこんな話をしました。

佐藤さん

俺たちみたいなビジネスマンはNewsPicksを見ている人が多いけど、大学生とか大学院生も見たりするの?

らんらん

みんなはどうか分からないですが、私は結構見ますよ!

佐藤さん

僕はいろんな視点からのコメントが面白くて、わりとそっちメインで見たりもするんだけど……コメントは読んだりする?

らんらん

ん〜超絶なんとなくですが、辛口で怖いビジネスおじさんがたくさんいるイメージで……あんまり読まないかもです。ネガティブなコメントとか多いのかな〜って。

突然、会社の奥から現れた根来さん

根来さん

いやいやいや! ポジティブなコメントとかも多いから、ちゃんと見てみてよ。

らんらん

えー、本当ですか?

…という経緯で、NewsPicksのコメントはネガティブなものが多いのか? ポジティブなものが多いのか?  を機械学習を使って分析してみることにしました。

ネガポジ判定とは?

ネガティブ・ポジティブ判定とは感情分析技術の1つでその名の通り、対象となる文章などがネガティブかポジティブかを判定する手法です。ユーザーの好みや商品やサービスに対する満足度を調査するために口コミやSNSでの反応の分析に用いられています。

今回は、最近pick数が多かったNewsPicksに掲載された記事12本(6カテゴリ×2記事ずつ)に対するコメントを集めてネガポジ判定を行い、どんな記事にネガティブorポジティブなコメントが多いかを調べてみます。また、今回の判定には機械学習を使うので、Twitter上のポジティブbot・ネガティブbotのようなアカウントからツイートを習得し、学習データとしました。

分析に使った記事

  1. Appleが示した「現実主義のAI」
  2. グーグルがつくる未来都市では、道路が柔軟に「変化」する
  3. DMMおかんサービス終了で見えた、利用者急増なのにシビアな家事代行サービスの現実
  4. 深海、宇宙から自動車まで。電池はどんな進化を遂げてきたのか
  5. トルコショックより大きな危機が、これから世界経済を襲う可能性
  6. 決済電子化で税優遇 政府検討「QR」など導入促す
  7. 国税庁の「想定外」日本生命が生み出した「節税保険」
  8. 【完全解説】アマゾンとアリババが銀行を飲み込む日
  9. 「オレ、もう投げられない」金足農・吉田、仲間に告げた
  10. 高校野球入場者、史上初の100万人超え 100回大会
  11. 起業・独立を考える人に成功した起業家がオススメする10冊
  12. 【UZABASEカンファレンス】日本を代表する変革者が集結

ぜひ、どの記事にポジティブ・ネガティブなコメントが多いか予想してみてください!

分析中・・・

分析結果の発表

ポジティブなコメントが多い記事

12記事の中でポジティブなコメントが最も多かったのは、「【完全解説】アマゾンとアリババが銀行を飲み込む日」でした。

以上のように、コメントの74%がポジティブ、26%がネガティブという判定結果になりました。

実際にポジティブ・ネガティブと判定されたコメントをいくつか紹介します。

ポジティブだと判定されたコメント

曽根 秀晶さん(ランサーズ株式会社 取締役)のコメント
これは完全保存版記事ですね。よくまとまっている。Alipayのサービスの統合っぷりを見ると、あらためて金融サービスの未来の姿を感じる。

①預金、②融資、③決済といった銀行の基本3大機能に加えて④投資を金融の基本機能としたときに、②融資の肝となる与信判断は人からデータへ(cf. Amazon Lending)、③決済はモバイルシフトしサービス統合へ(cf. Alipay)、④投資の判断も人からデータドリブンな機械学習へ(cf. Yuebao)。そして総合的に、①預金のメインチャネルは銀行口座からデジタル/ビットウォレットへ。

国内でいうと、資本力とサービスラインアップをそろえている楽天、LINE、Yahoo(+Softbank)のメガIT 3強がどう出るか。そこに振興プレーヤーのmetapsとmercariがどう立ち向かうか。そして銀行陣営が銀行同士とあるいはIT陣営とどう戦うかもしくは組むのか。

規制産業である分、世の中で言われているほどすぐにトランスフォーメーションが起きるわけではないですが、一度変わりだすと不可逆な慣性の流れになる業界だと思います。ますます混沌とする中、国内でも今後どういう動きが出てくるか楽しみです

ネガティブだと判定されたコメント

岡村 聡さん(S&S investments 代表取締役)のコメント
日本の銀行サービスは法人・個人も海外周りが終わってて全く使えない。比較的、為替手数料は安かったので新生銀行を使ってたけど、何度か海外送金がエラーでお金戻ってきたのに数千円の手数料だけ取られる事があって、今はトランスファーワイズとかの送金アプリ使ってる。為替手数料も殆どなくて、送金手数料も数百円ですぐに送金できてホントに便利。

法人口座でも新生使ってるけど、最近オンライン送金海外から操作できなくてVPN使っても弾かれる。サイトを見たら理由の1つに、海外からのオンライン口座へのハッキング被害が書いてあって、自社のセキュリティしょぼいのを利用者に転嫁するとか言語道断だと思う。

シンガポールとか規制もメリット次第で柔軟に変わるし、アマゾンとかに金融サービスがんがんやってもらって、日本の銀行を一切利用しない生活とできたら大分快適になりそう

いずれも長文のコメントであるため、ポジティブな言葉とネガティブな言葉が混在していますが、全体的に見てどちらの言葉が多いかはきちんと判定されているようです。

ただ、ネガティブと判定されたコメントを見てみると、確かにネガティブな言葉は多く、日本の銀行に対してネガティブな印象を持っているという内容ですが、最後にアマゾンの金融サービスについては賛成している文章があり、この記事に対してはポジティブな立場からのコメントであると思われます。

このような結果からも分かる通り、それぞれの言葉の意味基準での分析は可能ですが、文章全体の文脈を読むというのは技術的にまだまだ難しいと言えそうです。

ネガティブなコメントが多い記事

12記事の中でネガティブなコメントが最も多かった記事は、「DMMおかんサービス終了で見えた、利用者急増なのにシビアな家事代行サービスの現実」でした。

コメントの44%がポジティブ、56%がネガティブという判定結果になりました。先ほどと同様に、ポジティブ・ネガティブと判定されたコメントの例を紹介します。

ポジティブと判定されたコメント

長崎 慶太さん(バーティカルメディア 営業職)のコメント

せっかく需要が大きい業界なのだから、供給側(人材)に寄り添ったサービスを作り上げれば良い。
例えば人材がユーザーに評価されるだけでなく、人材もユーザーを選べる仕組みにするとか。事前に会社側が家庭に訪問して状況把握をした上で、複数の人材と相談して派遣する人材を決定するとか。コストが増える分に関しては単純に価格を上げるべき。
同業競争からの脱落やクレームを恐れるあまり、ユーザーに対して下手に出すぎなのではないだろうか。
まぁ、業界淘汰が進めば自然にそうした形になっていくか。

ネガテイブと判定されたコメント

吉川 幸孝さん(株式会社シード 代表取締役)のコメント

これ、なんで価格あげて供給側を増やそうという話にならなかったのか、全くわからない。

シェアリングで良くある、ダイナミックプライシング的な要素を組み込めばwin-winなんじゃないだろうか。うちがやってる駐車場シェアリング(スマートパーキング)だって、ニーズが高い駐車場は、どんどん料金設定あげてるのに。

他の記事と比べるとかなりネガテイブなコメントが多い記事でしたが、それでも44%のコメントはネガティブだったことに少し驚きでした。確かに一つ一つのコメントを見てみると「問題は〜にあったのでは?」という内容のものが目立っており、この部分がネガティブと判定されたように思われます。一方で「もっと〜したらいいかもしれない!」という旨のコメントも多く、これらがポジティブだと判定されたのではないかなと思います。

各記事のネガテイブ/ポジティブ割合

上記の2記事を含めた12記事それぞれについたコメントのネガテイブ/ポジティブ割合がこちらです。

記事のジャンルで見てみると、テクノロジー関連の記事にはポジティブなコメントが多いと言えそうです。新しい技術やモノに対しては期待感の込められたコメントが多く書き込まれやすいということなのでしょうか。

らんらん

このような結果になりましたが、いかがでしょうか? 私はNewspicksはビジネスおじさんの怖いコメントが多いという偏見を抱いていたので、この結果には少し驚きました。もっとコメントも積極的に読むようにしてみようと思いました。

佐藤さん

確かにNewspicksのコメントをよく読んでみると、記事への批評というよりはその記事に関連する知識を披露し合っている…みたいな感じがするよね。だから、ネガティブなものよりもポジティブなものが多いという結果になったのかも。

根来さん

こうやって、ネガポジ判定をすることでNewspicksでコメントをしているユーザーたちの
特性のようなものが少し垣間見れたのはすごく面白かった。他にもいろんな分野に応用できそうな技術だと改めて思いました。

以上、Newspicksのコメントをネガポジ判定してみました。今回学習データに使ったのがTwitter上のテキストであったため、ある程度のネガポジは判定できましたが、ビジネス用語やIT用語など専門性の高い語彙についてはもしかするとうまく判定できていなかったかもしれません。より分析対象であるNewspickのコメントに近い語彙でが含まれるデータを学習させることで、さらに高い精度でネガポジ判定を行うことができるのではないかと思います。

今後もこのネガポジ判定のような感情分析技術はどんどんビジネスに応用されていくと考えられます。ぜひ、みなさんも他にもどんなものに応用できるかを考えてみてください!

関連記事一覧

  1. この記事へのコメントはありません。