さて前回は、「ウォークフォワード分析」評価の手順を見直しして、アウトサンプル評価をを行った結果、利益が出たものの偶然の域を出ないという事が判ったところまで書きました。今回は、問題の被疑箇所第一候補である「ポートフォリオの組み方」について試行錯誤している様子について書いてみたいと思います。
さて、前回大ショックだった、利益が偶然のレベルでしかないという事実。
そして、前回の記事で問題の被疑箇所として以下を挙げてみたのが以下。
【問題被疑箇所】
---------------------
1.トレードルールが悪い
2.最適化期間/WF期間選定方法の問題
3.最適化目的関数
4.ポートフォリオの問題
5.ローリング・モデル自体の問題
6.たまたま低迷期
---------------------
そして、前回記事のとおり、被疑箇所を上記「4.」に絞って試すことにした。
そして試すにあたって、やっぱり今回のトレードルールだと4年間のデータでは心もとないので、以下の図のイメージで都合8年間のデータで評価する事にした。
#結果、2005年1月~2006年12月は評価できないけど。
大雑把に言うと、6年間のデータを元にWF期間/最適化期間の組み合わせを通貨ペア毎に選定して、隣接する2年間で選定したWF期間/最適化期間でウォークフォワード分析を行って1つのアウトサンプル評価を行う。これを2年ずつずらしながら都合8年分のアウトサンプルデータを採取して評価する。
さて次は、ベンチマークとして何も考えずに、「多市場多期間最適化検証」で合格とした6通貨ペアすべての組み込み比率を均等にしてパフォーマンスを評価してみた。
以下はベンチマークのパフォーマンスサマリ。
【ベンチマークのパフォーマンス】
-------------------------
同時にとるリスクは口座残高の4%で、これを6通貨ペアで均等に割り振った。
#なので、1通貨ペアあたり1トレード初期リスクは0.66%
えーっと、前回の結果よりかなりいいんですけど。。。
しかも今回のケースで偶然発生しうるPFは1.08なので十分クリア。
95%信頼区間下限値もマイナスだけど、「-0.38」とごくわずか。
グラフで見ると後半がほぼ横ばいなので、前回と同じ期間である後半4年分だけ比較してみた。
純益は4,007US$→5,327US$と増加しているし、最大ドローダウンも、4年間で-6,789US$だったのが、8年間ででも-4,767US$と改善している。
やっぱり良くなってる。。
おっわりー!!
ちゃうちゃう。。。
-------------------------
さて、ポートフォリオを変更するにあたって、何を観点とするかを洗い出してみた。
【ポートフォリオ変更の観点】
-------------------------
1.収益性の高いものの組み込み比率を高くする
2.市場変化への追従性(R2シャープレシオ)が高い通貨ペアの
組み込み比率を高くする
3.相関関係が低い通貨ペアへの組み込み比率を高くする
-------------------------
もし前述の図で言う、「WF期間/最適化期間」で上記「1.」~「3.」の性質が継続されるのであれば、ポートフォリオの見直しによって「アウトサンプル評価対象期間」でのパフォーマンスも良くなるはず。
ポートフォリオ変更の観点毎にアウトサンプルでのパフォーマンス評価を実施してみた。
ただし他の条件は変えたくないので同時にとるリスクは口座残高の4%というのは変えずに比較。
【収益性の高いものの組み込み比率を高くする】
------------------------------
1.収益性が低い通貨ペア2つを除去
つまり、成績がいい4通貨ペアで評価。ただし、同時初期リスク4%は変更しないので、
1通貨ペアあたりの初期リスクは1%。
全然あかんやん。。。。
2.収益性が高い上位3通貨ペアの組み込み比率を高くする
じゃあ通貨ペア数を変えずに、パフォーマンス上位3通貨ペアの初期リスクを0.8%、
下位3通貨ペアは0.5%にしてパフォーマンス評価。
4通貨ペアの時よりも良くなったけど、ベンチマークよりどこをとっても悪い。。
3.結論
効果なし。過去いいパフォーマンスだった通貨ペアがその後良いパフォーマンス
になる訳では無い。
------------------------------
さて次は、市場変化への追従性の観点。
【市場変化への追従性の高いものの組み込み比率を高くする】
------------------------------
要は、以前のブログ記事で書いたR2シャープレシオが高い通貨ペアの組み込み比率を高くしてパフォーマンスを評価。
1.R2シャープレシオが低い2通貨ペアを除去する
なので4通貨ペアで、1通貨ペアあたり1%の初期リスク。
ベンチマークと比較してやっぱ全然あかんやん。。。
2.追従性が高い上位3通貨ペアの組み込み比率を高くする
通貨ペア数を変えずに、R2シャープレシオが高い上位3通貨ペアの初期リスクを0.8%、
下位3通貨ペアは0.5%にしてパフォーマンス評価。
ベンチマークと比較すると、若干だけど、年率調整済みリターンが向上!
純益は誤差レベルの低下だけど、最大ドローダウンが少し改善してる。
資金残高曲線の滑らかさという観点では2勝2敗なので、どっちがいいとも
言い切れない雰囲気。
リワード・リスク比率が改善したかもしれない!
なので年次毎に、純益/最大DD/純益÷最大DDをベンチマークと比較してみた。
●比較結果
結局年次毎に見てみると、平均のレベルでベンチマークの方がいい結果。
ちなみに上の表には載ってないけど、年次毎純益の標準偏差は減少してた。
なので、ベンチマークと比較して良くなった観点は偶然のレベルと考えたほうが
自然っぽい。。。
------------------------------
次はパフォーマンスの通貨ペア間相関係数の観点
【通貨ペア間の相関係数が高いものの組み込み比率を低くする】
------------------------------
相関係数がどのセグメントでも、EURUSDとUSDCHFが一番高くて、0.5付近。
なので、この2つの通貨ペアの初期リスクは0.4にして、他の4通貨ペアは0.8にしてみた。
期待することは、リターンが増えるというより、資金残高曲線が滑らかになるかドローダウンの改善。
結局ほとんどいいとこなし。
#唯一良くなったのは純益が81US$増加した点ぐらい。
------------------------------
結局ベンチマークの結果が一番よくて、あえて定期的に見直すとすれば「2.追従性が高い上位3通貨ペアの組み込み比率を高くする」が一番ベスト。
「堅牢性」という観点で言うと、妙なパラメータを含まない分、全部一律であるベンチマーク方式がいいんだろうけど、「市場変化への追従性」という観点で言うと、前述「2.」がいいのかもしれない。
検証したパフォーマンス自体は大差が無いので、素直な「ベンチマーク方式」を選ぶ事にした。
【ベンチマークのパフォーマンスは偶然かどうか】
------------------------------
じゃあ、「ベンチマーク方式」のパフォーマンスは偶然か必然どうかを検証してみた。
PF観点としては前述のとおり、偶然の域を上回っているので問題なし。
95%信頼区間下限値はマイナス(-0.38US$)だけど、誤差レベルで実質問題なさげ。
あとはブートストラップ法での検証。
今回も、ブートストラップ法による検証ツールで、10万回&90%信頼区間で検証してみた。
●ブートストラップ法による検証結果
============================================
o Original average of data,12.314351
o p-value(percentage),2.869000
o Confidence interval(lowest) , 2.072920
o Confidence interval(highest) , 22.277848
--------------------------------------------
o Average data of simulation,12.314389
o +2sigma data of simulation,25.257766
o Highest data of simulation,43.391841
o -2sigma data of simulation,-0.628988
o Lowest data of simulation,-16.572627
============================================
p値は5%以下だし、信頼区間下限値は正数!!!!
合格!!
------------------------------
ただ素朴な疑問も。。。
【素朴な疑問と考察】
------------------------------
1.疑問の内容
今回「ベンチマーク方式」を選んだけど、通貨ペアの入れ替えってしなくていいの??
という疑問がフツフツと。
ポートフォリオに組み込む通貨ペアを入れ替えしなくていい理由って何????
#要は、ポートフォリオレベルで「市場変化への追従」対策しなくていいのかという点。
2.ここまでの検証プロセスの観点で考察
今回6通貨ペア内でやり繰りしようとしているけど、そもそもこの選んだ6つの通貨ペア、
「多市場多期間最適化検証」で評価した14通貨ペアの内、合格したものを抽出している。
そしてこの「多市場多期間最適化検証」は2001年~2008年の8年間のデータを元
に検証。
つまり、2001年~2008年のデータにカーブフィッティングしてる可能性があるって
こと??裏を返すと、2009年~2010年のパフォーマンスが真のアウトサンプルの
実力???
3.過去データに関する考察
2009年~2010年のパフォーマンスを見ると、利益が出ているとはいえ、他の年と
比較して、決して良いパフォーマンスとは言えない。でも、この10年間のパフォーマンス
の推移を見てると、全体的によくない時期があるのも事実。
4.問題切り分けに関する考察
カーブフィッティングなのか市場がルールに不利な時期だったのかを切り分けようとすると、
2009年~2010年のデータで「多市場多期間検証」と「多市場多期間最適化検証」を
して、評価対象としてる14通貨ペア全体が不調かどうかを調べればいいことになる。
不調であれば、たまたまルールが市場にあっていない時期だったとも言えるかも。
逆に好調であれば。。。。
5.ポートフォリオレベルでの市場変化への対応
仮に不調な年だったとした場合、対象にする通貨ペアを2年毎に直近過去8年の
「多市場多期間最適化検証」を14通貨ペアで行って、検証結果を元に入れ替える事で、
ポートフォリオレベルで「市場変化への対応」をすることになるのか。。。
大変やぞ。。。
あまりにもひどい通貨ペアは「多市場多期間最適化検証」の対象から除外して効率化するか。。
------------------------------
今度は3日間程度
PCを回し続けないといけないのか。。
PCを回し続けないといけないのか。。
そして、久々のForexTester2利用がうまくいくかどうか心配しながら「FXシステムトレード初心者奮闘記」は、2009年~2010年の「多市場多期間検証」/「多市場多期間最適化検証」に進むのでした。
#ぼちぼちUQ-WiMAXの環境構築しなきゃ。というかMT4用EA修正も必要なんやった。。
こんにちは。これってスプレッド込みレバレッジ無しでこのパフォーマンスなんでしょうか?
返信削除だとしたらすごいと思います。。。
匿名様
削除スプレッド込みです。
ロット数を動的に決めている事もあって、レバレッジは集計していませんが、レバレッジはかかっていると思います。