観客数と勝率の関係はあるのかしら?

2014年末、ツイッターのタイムラインにあるおもしろい画像付きの投稿が流れてきました。

秋田ノーザンハピネッツを応援しているアカウント@happyrabbit0303さんのもので、
私は図表にある有意に正の相関を認める(P<0.001) の部分の意味がいまいちわかっていなかった事を白状しておきます。同様に左下から右上に引かれた線もなんだこれ?な状態でした。

スペインの場合はどうだろうか?

幸いにも自分はスペインの1部リーグLiga ACBの観客動員数データ(公式発表数値)の一覧を持っている、さらに順位表から勝率も簡単にわかるので、これはスペインリーグ版も作ってみようと思ったわけです。

使用したのはエクセル2010(自宅のメインPCに入っていたのが2010だった)でした。

とりあえず、数字を入力して散布図でグラフ化して、本当は青いポチのところにチーム名を自動表示したかったんですが、エクセル2010だとデータラベルをつけるのができないとかで(この時仕事用のノートPCに入ってるエクセル2013でやればよかったなーと後悔)、でもとりあえず完成してアップしてみました。

ざっくり見たところだと、平均観客動員数が多ければ勝率も良い(逆かな?勝率が良ければ平均観客動員数も良い)と言えなくもないのですが、スペインACBの場合、平均観客動員数が8,650人という人気チームであるエストゥディアンテスが4勝9敗と苦戦していたり、10勝3敗のFCバルセロナは実は平均観客数が4,774人だったりという当てはまらないものも出てきました。

リツイートされたりして反応があった!!

こうやって公開されているデータを加工して、簡単な分析をしただけでも反応があることは嬉しいものです。前述の@happyrabbit0303さんがRTしてくれたり、データ分析が好きという@ishikawaayakoさんがコメントをくれて、フリーソフトのRという統計ソフトを教えてくれたりしました。

観客動員数と言ってもいろいろある..

ここで1つ思いつき、ツイートをしてみました。観客動員数(平均)に対して、アリーナのキャパでどれくらい席が埋まっているか、そこに勝敗の相関図というものを絡めたら面白そうだなあ、と。スペインACBなら基本1チームが使うホームアリーナは同じところなので、データいじれば何かできそうなんだけど…と。

とツイートしたところ、@ZeeThaBQFさんが反応してくれまして、次のようなツイートをしてくれました!!!

左下から右上に伸びている線はなんじゃらほい?

あれあれ?こっちの散布図にも線が入っていて、中央左になんだこれ?な数式が書いてありますよ。
@ZeeThaBQFさんがコメントしているFtestの結果は3.4E-64。うーん、バルサ…。、これ正直意味がわからない。ググったけどこれもイマイチわからない。聞くは一時の恥聞かぬは一生の恥とは言いますが、まさにその通りですね。

そこで、私は年末年始にお勉強をすることにしました。ソーシャルメディアでうまいこと集合知じゃないですが、関心が合致すればお知恵をかりてたくさんの情報が集まりますが、まずは自身が基本・基礎を持っていないと話になりません。

[amazonjs asin=”4756917429″ locale=”JP” title=”仕事に使える! 「統計分析」が中学数学とExcelだけでできる本 (アスカビジネス)”]

お正月に読み始めました。電卓片手に、そしてエクセルをカタカタやりながら中学の数学でこんなことやったっけ?と思いながら、本当に仕事に役立つなこれー!!と思いながらやっております。近いうちにこのエントリーを10倍味わえる自分になっている気がします。

自分としては、平均観客動員数と勝率の因果関係を前年比とか、ホームチームの都市の人口比とか、スペインだったらAbono会員数(日本だったらブースター会員数とか?)数値公開されているかわかりませんが、そのへんとの因果関係も見てみたいですし、分析してみたいです。

追記)これも読んで勉強します

[amazonjs asin=”4053029236″ locale=”JP” title=”小中高ぜんぶまとめて計算本! (大人の教養SERIES)”]