うぺのえーあい競艇日記

いわゆる"AI"を使った競艇予想を書いたりする。ただの競艇好き。機械学習で儲けようといった気持ちはそんなにない(勝てたら嬉しいけど)。機械学習は強力だけど苦手な部分も多い子なので、そこを我々人間が補ってあげて、二人三脚で歩んでいけたらいいなと思っている。繰り返してですが、ほんとただの競艇好きです。世の中の人がもっとみんな競艇好きになったら嬉しい。

【競艇・機械学習】機械学習と人間の共同作業

色々と試行錯誤をしている内に、大分間が空いてしまった。

結論から言うと、機械学習に任せすぎるとやっぱり面白くないので、半分機械学習・半分自力の持ちつ持たれつ的なモデルを作った。

機械学習がやること

  • イン逃げ確定のレースを見つけ出す (テストでは約8割の正解率)

  • 2〜6号艇の2着率・3着率を見積もる

機械学習は、ニューラルネットSVMを用いている。

単純に言えば、ニューラルネットでいろんな情報をある次元のベクトルに集約して、SVMがそれを入力として、1頭かどうか、及び、他艇が連に絡むかどうかの2値分類を6個解かせている。

2〜5号艇に関しては、SVMが見積もった確率値に対してバックテストを行い、SVMの確率値を条件として、実際にその艇が連に絡んだかどうかの条件付き確率を算出した。

予測時はSVM出力の直の確率値とバックテストで算出した確率値を表示する。

例えば、本日2月9日大村1Rが予測対象になっていて、以下のようなものが出る。

https://boatrace.jp/owpc/pc/race/racelist?rno=01&jcd=24&hd=20180209

f:id:kohilinus:20180209114012p:plain

f:id:kohilinus:20180209113244p:plain

SVMの出力値(連に絡む確率)は、2号艇から順に29%、58%、57%、20%、5%となっている。

バックテストにおける2着率は、2号艇から順に19%、34%、33%、4%、1%。

3着率が26%、14%、27%、11%、4%で、最後の列が両者の和で3連対率である。

モデルに従えば、広く買うなら【1−234−2345】、絞るなら【1−34ー234】といったところだろうか。

自分でやること

  • 2着以下の組み合わせを選定する

  • 全検・事前レース・展示などモデルが知らない情報を考慮する

  • オッズを見て、切ったり・追加したりする

モデルはその節のそれまでの成績を考慮しているものの、他の多くの情報もあるため、経験的には潰れてしまっている可能性が高い。

また、動画の特徴量は用いていないため、実際の選手の乗り具合なども見れていないし、直前情報(展示や気候)もデータ取得の都合上入れていない。

この辺りを人間(僕)の方で鑑みて、上で挙げた組み合わせをアレンジする。

また、オッズも見ていないため、その辺りも購入舟券には反映すべき。

例えば、あまりに安すぎるような組み合わせは外したり、逆に、多少確率的には低くても、期待値ありそうなオッズであれば買うべきだろう。

さて、上のレースは、大村最終日1レース目である。

最終日1レース目は節を通して調子が悪かった選手が集められやすい。

このメンツであれば、A1級の1号艇原田は難なく逃げるだろう。

問題は2着以降である。

モデルとしては3号艇嶋田・4号艇山口推しであるが、【1−3−24】の目はオッズが安い。

f:id:kohilinus:20180209172050p:plain

まあ、このメンツを見れば順当な人気かなあと思う。

山口はいくつか不安材料もある。

  • スタート展示遅れ

  • F1持ち

  • 最終日一般戦(無理をする理由がない)

  • 連対は初日1コースからの1回のみ

以上を踏まえると、【1−3ー24】が本命なのは間違いない。

ただ、やっぱり安いので正直うまい舟券ではないと思われ。

それよりは、3号艇嶋田が攻めて開いた懐を4号艇山口がしれっとさして【1−4ー23】の方が美味しそうな気も。

それで本命が来たら、それは仕方ない、ということで。

結果。【1−3−2】。390円。

大本命決着。4号艇山口は多少スタート遅れ気味。45メートル付近でレバーを放ってる気がする。 5号艇石田に出られる形で、窮屈になったため、ワンマークは後手を踏んだ感じだったな。 最内差して、3着争いには残るかとも思ったが、6号艇が狭いところ割って入って来た結果、沈んでしまった。 まあ、こういう外し方は仕方ない。 山口はこういうレースするのかあ。今後買うことはなさそうである。 逆に5号艇石田は破れたものの、F1持ち、最終日、一般戦という条件ながらしっかりスタート踏み込んだのは好印象である。

所感

と、まあ、こういう感じのモデルでしばらく行こうかと思っている。

一日だいたい10レースくらい推薦してきて、これまでの二月のレースを見る感じ、事前テスト通りだいたい8割くらいのイン逃げ的中率である。

2着は、体感6・7割モデルの3連対率が高いところ二つに入っている感じがある。ただ、その場合基本的にオッズは10倍を割っており、5倍を割ることも少なくない。

そういう買い方をするならば、直前オッズを見ないで買うとガミる可能性が高いだろう。

3着は、あんまり当てにならない気がする。2着で本命を外すなら、本命のヒモが正答率は高くなりそう。オッズも低くなるけど。

例えば、準優勝戦・優勝戦の5、6号艇のように、中穴も想像できるようなら、流したら良いかと。

上の大村のレースのような場合、中穴狙うにしても絞った方が良さげかな。

それと、確証はないが、1号艇が破れたレース(イン逃げ予想失敗)で、勝った選手はその節なんかいい成績を納める傾向にある気がする。

A級レーサーなら準優以上に乗っており、B級レーサーでも4割くらいは連に絡んで、1着もちらほらある感じ、場合によっては準優にも乗る。

イン逃げ外すとちょっとショックだが、いい情報が得られたというプラス思考もありかと。