「統計検定とは?」な人が多いと思いますが、言葉のとおり統計に関する資格です。
試験自体に興味のある方は受験記ご覧ください。
【受験記録】統計検定3級
本業(IT業界)でも機械学習、ビックデータなど耳にすることが増えたこともあり、以前から「統計学」というものには興味はありました。
これに「EAの検証に使えそう」という要素が加わり、ちゃんと学んでみようかなと。
今回に限らず私は今まで何かを学ぼうと思ったら資格の取得を目標にして学習をします。
・学習へのモチベーションの維持
・資格のような目標がないと参考書を読んでも頭に残らない
・試験勉強、試験対策が嫌いじゃない
・資格を持ってるだけで「スゲー」と思ってくれる人がいる
といった理由からです。
こんな理由で今までに取得した資格は
Java、Oracle、情報処理、MIDI検定、XML、簿記、心理士、UMLなど色々。
今回、これに統計検定が加わりました。
本業に関係するIT系の資格はそこそこのレベルのモノを取ってますが、それ以外は入門レベルです。
EA検証に活用
では実際、統計の考えをEA検証にどう使えるか。試しにバックテスト結果を見てみましょう。
EAはみんな大好き「1本勝ち」です。
この情報から何がわかるようになったか。
「この情報だけではどんなEAかわからない」ということがわかるようになりました。
強いていうならトレード数ぐらいでしょうか。
11年で2920回なので年間265回。
「1日1回ぐらいのペースなのかな?」と想像するぐらいです。
「よくわからない」という事がわかったことは私的には充分な進歩だと思っています。
少なくともペラ1枚のバックテスト結果と睨めっこすることはなくなりました。
そして更なる情報としてトレード結果のヒストグラムを見るようになりました。
↓のようなグラフです。
縦はトレード数、横は収支結果(幅は300)です。
これを見ればどんなEAなのかぼんやり見えてきます。
・大半のトレードは-300~300の範囲で終わっている
・-4000ぐらいに小さな山があるので、SL以外の負け方もありそう
・グラフでは見えないぐらい少数だが豪快に勝つことがありそうだ
というのはザックリ読み取れます。
そしてこれをもう少し深掘りしていくために以下の値を算出します。
・最大値、最小値
・四分位数(25%地点、50%地点、75%地点)
四分位数を知らない人はggrksの方針で。
・最頻値(最も多く登場する値)
一本勝ちの値はこうなりました。
最大:19750
75%地点:1210
50%地点(中央値):100
25%地点:-40
最小:-8100
最頻値:30
これらの情報が加えてグラフを見ると
・最頻値の30を中心に50%は「-40~1210」の範囲で終わる
・「1210~19750」が25%あるが、そのうちの大半は5000ぐらいで終わる。
・「-8100~-40」も25%あるが、「-300~0」の山が大きいので何とも言えない。
という風に見えてきます。
何とも言えない「-8100~-40」の範囲は大負けする頻度がわかればいいやと思ったので、グラフで小さな山になっている-3600以下の比率を求めました。
結果、「11%(2920件中327件)が-3600以下」ということがわかりました。
件数をとるついでにグラフが見えなくなっている5700以上の比率も出して「0.9%(2920件中25件)が5700以上」という情報も加わります。
これで終了です。
まとめると
◆トレードの50%は「-40~1210」の範囲。中でも30~100ぐらいが多い。
◆トレードの25%は「1210~19750」。5700を超えるのは全体の0.9%しかない
◆トレードの25%は「-8100~-40」。-3600以下で損切りするのは全体の11%ある
こんな感じでしょうか。
私は1本勝ちを2年ぐらい使用していますが、この結果を見て「まぁ、そんなもんかな」という印象です。
導入直後に7000をぶち抜いたのは相当幸運だったんだなと思いました。
というように統計学3級の学んでデータ分析に使える情報、知識が増えた気がします。
「引き出しが増えた」とも言いますね。
個人的には学んでみて損はなかったです。
ちなみに今回使ったグラフ、四分位数などの値はExcelで簡単に求められます。
バックテスト結果のExcelへの変換はサイト(ゴゴジャンなど)からダウンロードしたhtmlファイルの拡張子をxlsに変える方法が簡単ですよ。
「backtest.html」→「backtest.xls」
0 件のコメント:
コメントを投稿