
うちの社長の名刺データ分析してみた!【SalesTech】
どうも!okajiと申します!
今回!
社長から「Eightの名刺データが3439枚あるから、それから傾向値とってみてほしい!」との事で、
面白そうだと思い記事化しました!
社長から「Eightの名刺データが3439枚あるから、それから傾向値とってみてほしい!」との事で、
面白そうだと思い記事化しました!
現在、情報化社会と呼ばれFacebookやTwitter、Google等のIT企業が各企業の持つデータを使って
より良いAIや分析結果を発表しています。
より良いAIや分析結果を発表しています。
この状況から、“データは宝である”といっても過言ではありません。
顧客情報や顧客ごとの動き方を知ることで、Webマーケティングでの良い成果が期待できます。
しかし、“扱い方”を間違ってしまうと精度の悪いAI、分析結果が出来上がってしまうことも…
そのため、データ分析は”前処理が8割”と言われているほど重要です!
本記事では簡単なデータ分析の方法からちょっとした可視化までやっていきたいと思います!
使用した言語・モジュール
言語
・Python 3.7.3
モジュール
・matplotlib 3.0.3
・MeCab 0.996.3
・folium 0.8.3
・pandas 0.24.2
・データ分析の流れ

・実際にやってみた
今回、データ分析の流れの中のクリーニング処理と、単語分割を行いました。
また、傾向値として取得しやすい氏名、役職、住所を分析していきます!
・氏名
最初に、氏名欄がNullとなっているものと、「Eight」で読み込めなかった際に表示される「*」が氏名内に存在していないかの判定と除去を行います。
その結果3439件から3080件になりました。
このデータを使って分析した結果がこちらになります!

1位が社長と同じ”佐藤“になるのかと思いましたが、実際は鈴木さんが1位でした!
また、全国名字ランキングと今回の結果を見比べてみると
なんと、全国名字ランキング15位以内の名字が今回の結果トップ10に含まれることが分かります。
やはり傾向として似るのかもしれませんね!
・役職
次に役職の部分を見ていきましょう。
氏名で行った前処理に加え、役職の分割を行っていきます。
というのも、多くの方が「社長兼CEO」だったり、オーナーを行ったり複数の事業を行っているためです!
「/」「兼」「&」が含まれた場合、分割を行っていきます!
その結果、このようになりました。

あ、圧倒的に代表取締役の方が多い…!
また、取締役社長、取締役、代表、CEOとTOP5の役職がとんでもないですね!
社長の人脈には驚かされます…!
・住所
今回、Eightの名詞データ内にある住所から、名刺交換した方がどの地域、エリアにいるのか見ていきます!
実は、GoogleMapのマイマップを使うことで見る事ができます。
結果がこちら
せ、世界に行くんですね…!
次に多くピンのある日本を見ていきましょう
東日本にも点在し、西日本にも…
東京付近が一番多いですね!
ここで、東京もGoogleMapで見たいところですが、
ピンが多く表示され見づらいことが予想できます。
そのため、東京23区に関してPythonでエリア別で傾向を見ていきます!
今回も氏名で行った前処理を行いました。
住所から行政区分コードを割り振り、pandasモジュールのgroupbyを用いて数えていきます。
また、有志の方が作成している「JapanCityGeoJson」と、モジュールの一つ「folium」を用いることで、
塗り分け図(コロプレス図)を作成することができます!
塗り分け図(コロプレス図)を作成することができます!

色の濃いエリア程、名刺交換を行った方がいるエリアです。
また、ピンの位置はアローサル・テクノロジー株式会社のある地点を指しています。
港区、渋谷区はIT企業が多いイメージでしたので、予想通りではありますね!
僕個人の感想ですが、重力モデルのように近い者同士は惹かれ合うように見えますね!
(*重力モデル :ニュートンの万有引力を模倣して、地域間の相互作用を分析・予測・記述するために用いられるモデルのこと )
・分析結果 まとめ
・名刺内にある名字と、全国名字ランキングの上位がほぼ同じ
・社長の人脈が凄い
・IT企業が多いエリアとの名刺交換が多い
・最後に
いかがだったでしょうか。
今回Pythonとpandas,GoogleMapを主に用いて分析を行ってきましたが、予想通りである事が多かったですね。
前処理や情報量が欠けているデータでしたが、Eightのデータだけでも大体の役職や業界、
活動エリアが推測できることがわかりました。よって、以下にまとめられます。
活動エリアが推測できることがわかりました。よって、以下にまとめられます。
・データは宝
・分析可能なデータを正しい項目別に持つことが重要
・詳細で正しいデータがあればもっと精度の高い分析が可能
しかし、これに日付などがあれば時系列データとして扱うことが可能で、
「この日多くの人と名刺交換が行われているから、TECH BARだな!」
「この時期こんな役職の人と多く名刺交換しているからもしかして…?」
と言った事も出来るようになります。
そのため、データの管理やデータの扱い方を大事にしていきましょう!
上記のまとめを意識して会社のデータを蓄積することができたら、
これからの時代他社よりも一つ先に行けること間違いなしですね!
これからの時代他社よりも一つ先に行けること間違いなしですね!
また、コードが気になるという方はコメントくださると幸いです!
以上、okajiでした!
この記事へのコメントはありません。