楽しいデータ分析 上司が帰るのを見て帰宅する奴は誰だ?

Pocket
このエントリーをはてなブックマークに追加

こんにちは、奥家 耀介 です

データ分析って、なんか難しい・・。統計数理なんて色々勉強するんだけど長続きしない。今回は、そんなデータ分析に気難しさを感じている方に少しでも面白さが伝わればと。

社内で” 楽しくデータ分析する方法 ” というのを新人研修でワークショップ的にやっています。その分析結果を面白かったので紹介したいと思います。

スポンサードリンク

style="display:block"
data-ad-client="ca-pub-7131454004752794"
data-ad-slot="2164631060"
data-ad-format="auto">


テーマ:上司が帰るのを見計らって帰る部下は誰だ?

かなり強烈なテーマ名ですが、この令和の時代にも関わらず、昭和に生きて来た上司は、”部下が上司より先に帰るなんて”・・・てのが染みついていますから、「俺より先に帰るなよオーラ」をプンプン出している上司がいるわけですよね。(自分も昔そうだったなぁ)

”俺はそんなオーラ出していないし、部下自ら帰宅を判断すべきだ” と思っている上司の方、本当にそうでしょうか?数字は嘘をつきません。このデータ分析で部下から帰る時間を見られてないか確認しては?

分析方法:相関係数とは?

それでは分析してみましょう。分析方法は簡単です。相関係数というのを使います。

2つの値の関連性を調べる目安となる値のこと。-1.0~1.0の範囲に値を取り、絶対値が1に近いほど関連性が強く、0に近いほど関連性が弱いとされる。正の相関では相関係数が1に近く、負の相関では、相関係数が-1に近い値になる。無相関では0に近くなる。
出典:コトバンク

分かりやすい例を挙げると、”気温が上がれば、アイスクリームの売り上げが上がる”とした場合の気温という温度の値と売上金額という値は、関連性が強く1に近くなると言えます。

ここで2つの値2人の行動に置き換えてみましょう。つまり、2人の行動が似ているならば、1に近くなり、似てなければ0に近くなるという事。。一卵性の双子は、1に近くなるとイメージしてもらえればいいと思います。

そう、この相関係数を利用して・・・。
上司が帰ったら帰る部下というのは、上司の帰宅時刻と部下の帰宅時刻に強い相関性がある」という仮説からデータ分析しようという事です。

分析に準備するものと算出方法

帰宅時間データの準備

上司、部下各々の帰宅時刻を表計算ソフトデータ(ここではEXCEL)で用意してください。
 ・上司は一人、部下は複数人分必要です。(誰がを見つける為)
 ・出社時間は不要です
 ・帰宅時間のデータ量は多ければ多いほど精度が高まります。
人事部に聞いて部署全員の勤怠データがもらえるならばもらってください。多くの人はそうは出来ないと思うので、きちんとデータ分析対象者に言ってデータをもらいましょう。

こんな感じ↓

不要なデータの削除

相関係数は、比較する値の数が合っていないといけません。誰かが休みの日があると比較する数が変わるので、その日のデータは消しましょう。また、土日等不要なデータは削除しましょう
こんな感じ↓

上司・部下の帰宅時間の相関係数を求める

帰宅時間からEXCELのCORREL関数を利用して、上司と部下各々の相関係数を求めていきます
こんな感じ↓
CORREL関数の使い方はこちらが分かりやすい

相関係数は一般的に”0.7以上で関連が強い”と判断され、ここでは+1.0に最も近い部下Bが上司の帰宅時間と関連が強いと判断されます。
※赤字は部下AのCORREL関数の数式です

上司より遅く帰っている部下の回数を求める

ここで部下Bが ”上司が帰るのを見て帰宅する奴” と判断するのはまだ早いです。実際の帰宅時間を見ると、部下Bは上司よりも早く帰っている回数が多いようです。そこで EXCELの関数を利用して、遅く帰っている回数を求めます。

こんな感じ↓
IF関数の使い方はこちらが分かりやすい
※赤字は部下Aの上司帰宅時間との比較式です

結論:上司が帰るのを見て帰宅する奴は?

上司より遅く帰って、尚且つ帰宅時間の相関性が高い部下Aだと分かりました。ここでは分かりやすく極端なデータ値を使いましたが、実際は0.9以上の相関係数値が出ることはほとんど無いです。私の所属している部署でも、0.65が最大でした。(ということは上司の帰宅状況を見て帰ると言う部下はいないという事かな・・・(笑))もし出たとしたら、もうそれはストーカーレベルを疑った方がいいかもしれませんね。(笑)

楽しいデータ分析の効果

データ分析する人、俗にデータサイエンティストは昨今DataRobot等のツールの普及によりハードルが下がっているとはいえ、まだまだ高度なスキルを要する分野です。そして、そのサイエンティストの高度な分析結果を見るビジネス側の人は、データ分析の素養が無いと(サイエンティストの出す結果に)良いも悪いも判断できません。こういった楽しいデータ分析を通して、難しい分野であってもその基礎力を上げる工夫が、社内の教育現場に必要だと思っています。事実、私が講師のこの楽しいデータ分析講義が一番人気があり、分析に興味を持った若手が先輩を差し置いて、顧客の受注を勝ち取ったなんて成果も出しています。

その私が研修で参考にしている書籍を紹介します。以下。

何れもデータ&ストーリー LLC 代表 柏木氏の著書です。柏木先生の講義は好評で私は日経主催の講義を3つも受けました。(一人の講師の講義を3つも受けるなんて、フツー異常です(笑))。柏木先生は、世間でよくある間違ったデータ分析を分かりやすく説明してくれます。統計学云々といった難しいモノではなく、ビジネス問題解決という目的に向けたデータ分析をステップ的に紹介してくれますし、ロジカルシンキングの講義もされているので非常に論理的で分かりやすいです。本当にお勧めです。(これ以外のデータ分析書籍は見なくても良いですというレベル)。書籍を全部見ましたが、上記の3冊で大体分析の本質は理解できます。

書籍、講義を受けまくった影響でしょうか、最近、柏木氏のしゃべり方に似てきています(笑)。

最後までお読み頂き、ありがとうございました。

ではでは~。


Sponsored Link