【競艇・機械学習】機械学習と人間の共同作業
色々と試行錯誤をしている内に、大分間が空いてしまった。
結論から言うと、機械学習に任せすぎるとやっぱり面白くないので、半分機械学習・半分自力の持ちつ持たれつ的なモデルを作った。
機械学習がやること
イン逃げ確定のレースを見つけ出す (テストでは約8割の正解率)
2〜6号艇の2着率・3着率を見積もる
単純に言えば、ニューラルネットでいろんな情報をある次元のベクトルに集約して、SVMがそれを入力として、1頭かどうか、及び、他艇が連に絡むかどうかの2値分類を6個解かせている。
2〜5号艇に関しては、SVMが見積もった確率値に対してバックテストを行い、SVMの確率値を条件として、実際にその艇が連に絡んだかどうかの条件付き確率を算出した。
予測時はSVM出力の直の確率値とバックテストで算出した確率値を表示する。
例えば、本日2月9日大村1Rが予測対象になっていて、以下のようなものが出る。
https://boatrace.jp/owpc/pc/race/racelist?rno=01&jcd=24&hd=20180209
SVMの出力値(連に絡む確率)は、2号艇から順に29%、58%、57%、20%、5%となっている。
バックテストにおける2着率は、2号艇から順に19%、34%、33%、4%、1%。
3着率が26%、14%、27%、11%、4%で、最後の列が両者の和で3連対率である。
モデルに従えば、広く買うなら【1−234−2345】、絞るなら【1−34ー234】といったところだろうか。
自分でやること
2着以下の組み合わせを選定する
全検・事前レース・展示などモデルが知らない情報を考慮する
オッズを見て、切ったり・追加したりする
モデルはその節のそれまでの成績を考慮しているものの、他の多くの情報もあるため、経験的には潰れてしまっている可能性が高い。
また、動画の特徴量は用いていないため、実際の選手の乗り具合なども見れていないし、直前情報(展示や気候)もデータ取得の都合上入れていない。
この辺りを人間(僕)の方で鑑みて、上で挙げた組み合わせをアレンジする。
また、オッズも見ていないため、その辺りも購入舟券には反映すべき。
例えば、あまりに安すぎるような組み合わせは外したり、逆に、多少確率的には低くても、期待値ありそうなオッズであれば買うべきだろう。
さて、上のレースは、大村最終日1レース目である。
最終日1レース目は節を通して調子が悪かった選手が集められやすい。
このメンツであれば、A1級の1号艇原田は難なく逃げるだろう。
問題は2着以降である。
モデルとしては3号艇嶋田・4号艇山口推しであるが、【1−3−24】の目はオッズが安い。
まあ、このメンツを見れば順当な人気かなあと思う。
山口はいくつか不安材料もある。
スタート展示遅れ
F1持ち
最終日一般戦(無理をする理由がない)
連対は初日1コースからの1回のみ
以上を踏まえると、【1−3ー24】が本命なのは間違いない。
ただ、やっぱり安いので正直うまい舟券ではないと思われ。
それよりは、3号艇嶋田が攻めて開いた懐を4号艇山口がしれっとさして【1−4ー23】の方が美味しそうな気も。
それで本命が来たら、それは仕方ない、ということで。
結果。【1−3−2】。390円。
20180209大村1R pic.twitter.com/BfbKHwWwa1
— こひ (@KohitaR) 2018年2月9日
大本命決着。4号艇山口は多少スタート遅れ気味。45メートル付近でレバーを放ってる気がする。 5号艇石田に出られる形で、窮屈になったため、ワンマークは後手を踏んだ感じだったな。 最内差して、3着争いには残るかとも思ったが、6号艇が狭いところ割って入って来た結果、沈んでしまった。 まあ、こういう外し方は仕方ない。 山口はこういうレースするのかあ。今後買うことはなさそうである。 逆に5号艇石田は破れたものの、F1持ち、最終日、一般戦という条件ながらしっかりスタート踏み込んだのは好印象である。
所感
と、まあ、こういう感じのモデルでしばらく行こうかと思っている。
一日だいたい10レースくらい推薦してきて、これまでの二月のレースを見る感じ、事前テスト通りだいたい8割くらいのイン逃げ的中率である。
2着は、体感6・7割モデルの3連対率が高いところ二つに入っている感じがある。ただ、その場合基本的にオッズは10倍を割っており、5倍を割ることも少なくない。
そういう買い方をするならば、直前オッズを見ないで買うとガミる可能性が高いだろう。
3着は、あんまり当てにならない気がする。2着で本命を外すなら、本命のヒモが正答率は高くなりそう。オッズも低くなるけど。
例えば、準優勝戦・優勝戦の5、6号艇のように、中穴も想像できるようなら、流したら良いかと。
上の大村のレースのような場合、中穴狙うにしても絞った方が良さげかな。
それと、確証はないが、1号艇が破れたレース(イン逃げ予想失敗)で、勝った選手はその節なんかいい成績を納める傾向にある気がする。
A級レーサーなら準優以上に乗っており、B級レーサーでも4割くらいは連に絡んで、1着もちらほらある感じ、場合によっては準優にも乗る。
イン逃げ外すとちょっとショックだが、いい情報が得られたというプラス思考もありかと。