競艇えーあい性能まとめ
この記事の最後に、イン逃げに関する各種記事へのリンクをまとめてます!
こんにちは、うぺです。
この記事では、モデルの性能を簡単にまとめます!
モデルの学習は2017年4月から12月までの37738レース!
そしてその性能の評価を2018年1月から2月の8515レースを対象に行いました。
(欠場が合ったり、同着があったりするレースは学習・評価から外しているので、そういうレースは対象外ということでお願いします。)
モデルの仕組みは非常にシンプルで、各レースに対して以下の22項目の2値分類を解かせています。
項目 | 学習内容 | |
---|---|---|
1 | スロー優勢 | イン3艇(1〜3号艇)が1着を取るかどうか。(スロー3艇ダッシュ3艇進入想定) |
2 | ダッシュ優勢 | アウト3艇(4〜6号艇)が1着を取るかどうか。(スロー3艇ダッシュ3艇進入想定) |
3 | 本命狙い | 3連単払い戻しが1000円以下かどうか。 |
4 | 穴狙い | 3連単払い戻しが10000円以上かどうか。 |
5 | 1号艇1着率 | 1号艇が1着を取るかどうか。 |
6 | 1号艇2着率 | 1号艇が2着を取るかどうか。 |
7 | 1号艇3着率 | 1号艇が3着を取るかどうか。 |
8 | 2号艇1着率 | 以下同。 |
9 | 2号艇2着率 | |
10 | 2号艇3着率 | |
11 | 3号艇1着率 | |
12 | 3号艇2着率 | |
13 | 3号艇3着率 | |
14 | 4号艇1着率 | |
15 | 4号艇2着率 | |
16 | 4号艇3着率 | |
17 | 5号艇1着率 | |
18 | 5号艇2着率 | |
19 | 5号艇3着率 | |
20 | 6号艇1着率 | |
21 | 6号艇2着率 | |
22 | 6号艇3着率 |
学習部分については、端的に言うと近年のディープラーニングの手法+伝統的(?)なSVMを組み合わせてやってます。
詳しい内容は、そのうち気が向いた時に記事を書く(つもり)。
さて、気になる性能評価の方ですが、バックテストを行いました。端的に言えば、
「こういう値が出ていた時、どういう結果になっていたのか」
という解析結果で、モデルの精度みたいなものがわかります。
グダグダ言うより例を見るのが一番早い!!
以下の表は、1号艇1着率の各推定確率における1着分布を表していて、列が推定値、行が艇番になってます。
推定確率 / 艇番 | 0-0.1 | 0.1-0.2 | 0.2-0.3 | 0.3-0.4 | 0.4-0.5 | 0.5-0.6 | 0.6-0.7 | 0.7-0.8 | 0.8-0.9 | 0.9-1.0 |
---|---|---|---|---|---|---|---|---|---|---|
1 | 20% | 27% | 36% | 42% | 47% | 56% | 62% | 68% | 73% | 80% |
2 | 28% | 21% | 22% | 21% | 18% | 14% | 11% | 9% | 7% | 6% |
3 | 18% | 22% | 18% | 14% | 14% | 12% | 9% | 8% | 7% | 6% |
4 | 18% | 16% | 11% | 11% | 11% | 9% | 9% | 8% | 8% | 5% |
5 | 11% | 10% | 9% | 6% | 6% | 5% | 6% | 5% | 3% | 3% |
6 | 5% | 5% | 5% | 6% | 4% | 3% | 3% | 3% | 2% | 0% |
出現回数 | 152 | 484 | 772 | 1050 | 1154 | 1343 | 1392 | 1272 | 780 | 116 |
こんな説明では、「はて、なんのこと?」、という感じだが、、、。
具体的に行きます。
推定確率が0.8−0.9の列を見てください。そこでは、1号艇73%、2号艇7%、3号艇7%、、、という感じになっていますよね?
これは推定値が0.8−0.9の間にあった時、1号艇が1着だった割合、2号艇が1着だった割合、3号艇が1着だった割合、、、、です。
つまり、「1号艇が8割位の確率で勝つよ!!」ってモデルが言ってる時は、だいたい7割位でイン逃げが決まるってことです!
一番下の数字は、評価用の8515レース中に当該の値が出てきた回数で、0.8−0.9の間の数値は780回出現しました。大体11レースに1回くらいで、1場で1日1回って感じですね。
この数字が小さい時は、たとえ上の確率が高く出ていても、信頼できないので、注意してください(たまたまうまく当てられただけ、かもしれないので)。
ぱっと見ると、推定値ー10%くらいが実際の値になりそうですねえ。
さて、一つの記事には文字数の関係で全部載せられないので、いくつかの記事に分けて書いていきます。
それぞれの解析結果別記事はこちら!!
・・・・(徐々に更新予定)。