tidyquantによるバックテスト(パラメーター最適化)
前回の記事の続きです。 takehana13.hateblo.jp
今回はバックテストデータをパラメータの値ごとに分析することを考えます。まずストラテジー全体を関数化します。
strategy_ema <- function(data, n){ term1 <- data %>% group_by(symbol) %>% tq_mutate(select = adjusted, mutate_fun = EMA, n = n, col_rename = "ema") term2 <- term1 %>% tq_mutate(select = adjusted, mutate_fun = ROC, col_rename = "roc") term3 <- term2 %>% mutate(sig = lag(if_else(adjusted > ema, 1, -1)), ret = roc * sig) term4 <- term3 %>% drop_na %>% mutate(eq = cumsum(ret)) %>% select(symbol, date, eq) }
次に複数のパラメータをベクトル化してストラテジー関数に渡しpurrr::map()
します。
param <- seq(10, 50, by = 10) opt_ret <- param %>% map(~strategy_ema(FANG, .x)) opt_ret <- opt_ret %>% set_names(str_c("param", seq_len(5))) opt_ret <- opt_ret %>% bind_rows(.id = "param")
最後に結果をプロットします。
opt_ret %>% filter(symbol == "FB") %>% ggplot(aes(x = date, y = eq, colour = param)) + geom_line() + theme_tq() + geom_hline(yintercept = 0, colour = "darkgray") + scale_color_tq()
この結果を見るとema(10)
のリターンが極端に低いことが分かります。
また同様のコードで他の銘柄のパフォーマンスも確認できます。
グーグルのパフォーマンスはFacebookものよりもパラメータの違いによる影響が顕著ではありません。