データマイニングの活用法

▼本日は、JRA-VANのデータマイニングについて、当研究所の見解を書いてみたいと思います。

まず、結論から書いていきます↓


・データマイニングとは、大量のデータを分析し、競馬の結果をあらかじめ予測するモデルのこと

・データマイニングは、単純に指数上位馬を購入しても勝てない。マイニング上位馬の単純回収率は70~80%程度しかない

・データマイニングの活用法としては、人気との乖離を狙うのが基本

・あるいは、データマイニング単体で馬券購入するのではなく、他のロジックと組み合わせて使うのが有効



ではこの根拠について、具体的に解説していきましょう。



▼JRA-VANの有名な指数に、「データマイニング」というものがあります。

データマイニング(Data Mining)とは、コンピュータがデータ分析して、レース結果を事前に予測するモデルのこと。

つまり、コンピュータ予測ですね。

天気予報や、経済予測、株価予測もコンピュータで行われますが、それの競馬版がデータマイニングです。

「マイニングとは、鉱山などで鉱脈から採掘すること。データの山から人間にとって有意義な情報を発掘することをたとえて、データマイニングと言われるようになりました」
JRAのサイトより引用



▼要するに、競馬の結果をコンピュータに予想させようというのが、データマイニングです。

マイニングでは、コンピュータがあらかじめ予想した順位が表示されます。

では、このデータマイニングを活用して、利益を出すことはできるのか?



▼私自身も、過去に実際にデータマイニングで馬券を買い続けてみたことがあります。

その経験から言うと、「データマイニングだけで利益を出すのは難しい」と感じました。

というか、単純にマイニング上位の馬を買うなどの戦略で競馬に勝つ事は、ほぼ不可能と言えます。



▼なぜ優秀なコンピュータが予想した順位が、実際の馬券で役に立たないのか?

それは、「コンピュータが期待値を考えていないから」だと思います。



▼コンピュータは、膨大なデータの中から有効なファクターだけを抽出し、そこから順位を予想しています。

あくまでも、「過去のデータからは、このパターンの馬が上位に来やすい」という予測であり、「この馬が儲かる」という予測ではないわけです。

なので、データマイニング上位馬の成績はまずまずなんですが、回収率はマイナスになってしまうわけですね。

記事後半では、実際にデータマイニングを活用した結果や回収率についても解説していきたいと思います。


競馬の年間収支をプラスにするサイトを公開

▼競馬ファンの最終目標である「年間プラス収支」

これを達成するためには、馬券知識を身につけるしかない。

私が、年間プラス収支を達成できたのは、

やっぱり⇒『このユニークなサイト』で学んだからです。




データマイニングの結果と回収率

▼ということで、マイニングについて、次の解説をしていきましょう。

先程の続き。

データマイニングは、コンピュータが上位に来やすい馬を予測している指数であり、期待値は考えられていない。

なので、データマイニング上位馬は、好走確率は高いが、回収率はプラスにはならない。



▼では実際に、データマイニング上位馬の回収率について分析してみましょう。


データマイニング。順位別の単勝回収率】2020~2023年

76(%)
80
74
82
80
75
74
68
74
63
70
66
66
62
69
55
34
35

(※上からマイニング1~18位)



はい。
過去3年半のすべてのレースにおいて、データマイニングの順位別の単勝回収率を集計すると、上記のようになります。



▼このデータを見るとわかるように、マイニング上位馬の単勝馬券を買い続けても、余裕でマイナス収支になることがわかります。

マイニング1位の単勝馬券を買い続けると、回収率は76%になる。

ごく普通の回収率ですね。むしろ単勝馬券の還元率80%を考えると、平均より少し低いくらいです。



▼同様に、マイニング2位は単勝回収率80%。マイニング3位は単勝回収率74%となっています。

マイニング上位馬の単勝馬券を買い続けても、全く儲からないわけです。

この理由が、先ほどから書いている通り、「マイニングは、期待値を考慮していないから」なんですね。



▼競馬というのは、強い馬を購入しても儲かりません。

競馬で儲かる仕組みというのは、「強いけど人気がない馬」を買うことで、期待値が歪み、そこから利益が生まれるわけです。

なので、単純に来る確率が高い馬を表示しているデータマイニングは、そのロジック単体では、利益を出すのは難しいわけです。



▼そこで、マイニングで利益を出すためのコツ・活用法として、「マイニング指数と人気との乖離を狙う」というものがあります。

これは要するに、「マイニング上位だけど、人気がない馬」を狙うということです。

こうすることによって、期待値が高い馬を購入することができます。



▼例えば、「マイニング1位で、9~10番人気の馬」は、複勝回収率が87~94%程度あります。

単純に、マイニング1位の単勝を買い続けた場合と比べて、回収率が一気に上がっているのが分かります。

このように、人気と指数との乖離を狙うことが、データマイニング必勝法に近づくヒントになるわけですね。


競馬で年間プラス収支を達成するために

競馬で勝ちたい人は、必ず見ておくべきサイトを紹介。
年間プラス収支の私が、ずっと利用している競馬情報でもあります。
 ↓↓
この馬券学校。

その他、無料で使える競馬情報ランキングは、こちらにまとめました。
 ↓
無料だけど役立つ競馬サイトランキング