シストレQ&A 確率・統計解析システムトレードのインディ・パ株式会社

インディ・パ株式会社Indepa Inc

確率・統計解析システムトレードのインディ・パ株式会社

Q&Aコーナーでは、お客様から頂いたシステムトレードや確率論・統計解析に関するご質問をまとめました。

時系列解析をこのまま続けても良いものでしょうか?

Q:
ひまわり証券のセミナーでの講義を聴かせていただいたのをきっかけに、システムトレードを行う根拠を統計的優位性に求めるという方針が決まりました。統計解析を本格的に行うためには「R」に熟達する必要もあると判断し「R」に関する学びも継続しています。
市場の予測には統計解析が役に立つこと、特に時系列解析は予測そのものであることがわかりました。しかし、時系列解析を学べば学ぶほど、当初の目的「翌日あるいは半日先の225先物の価格を読むこと」から離れて行くような感じがしています。AR・ARMA・ARIMAといった線形モデルで市場の動きをモデル化できる可能性は低いというのは、もはや”常識”のようです。本郷様の講義でも、株や為替の値動きは正規分布ではなくベキ分布にしたがっているとのことでした。
今、迷っている点は「このまま時系列解析の学びを続け、様々な非線形モデルに手を出すのがよいのか、あるいは時系列解析からは一歩身を引いてニューラル・ネットワーク等の手法で相場の天井・底を判断(機械学習)する路線へ転向するべきか」ということです。金融市場がベキ分布に従うと了解しておられる一方で、ダイナミックアームズは純粋な自己回帰モデル(AR)を駆使することでしっかりととしたパフォーマンスを確保しておられます。上記の迷いを整理するために体験談等をお聞かせいただければ大変ありがたいと思っております。
A:
こんにちは。
私の話がきっかけで統計解析に興味を持っていただいたことは大変嬉しいことです。
私が目指している事(数量的思考法を現実の問題に応用すること)でもあります。
さて、ご質問の件ですが、幾つか解決策があるかと思います。
1. 他の要素を取り入れる
私たちがダイナミックアームズの開発の過程で、単純なARMモデルではエッジが無いということが検証されました。
Yさんと同じ問題にぶち当たったわけです。
それをどのように解消したかと申しますと、ネーミングの「Dynamic」に関わることですが、自己回帰モデルのパラメータを週に1回更新することにしました。
理由は、統計解析の結果、相場付きといいますか、相場の統計的性質は時系列により変動することがはっきり読み取れたためです。
更新するための計算データは、6ヶ月分の5分足のデータを元に計算します。
膨大な計算量になりますが。。。
上記のような対策をとることで、ARMを活かせるという結論に至りまして、シグナル配信やソフト販売、自社資金の運用を行っています。
2.よりシンプルなモデルを採用する
時系列解析モデル、特に弊社が採用するモデルは、外部ファイルも使用して膨大な計算を行いますので、その分CPUパワーを消費します。
ハイスペックなマシン、頻繁な再起動が必要となります。
それよりも、先日のセミナーで公開させていただいたような、シンプルなアノマリーや相関性を利用したモデルの有効性を突き詰める方法もあると思います。
そこでも「R」のスキルはきっと活かせると思います。
以上、ご参考になれば幸いです。

Q&Aの最終更新日 : 2010-07-14

Dynamic ARMS FXに使用されている統計解析モデルは?

Q:
株価データを「R」に格納することにもようやく慣れてきたところです。
「R」に関しても、統計解析に関しても、まだまだヨチヨチ歩き(ランダム・ウォーク?)の今日この頃です。
前置きはさておき、質問させていただきたい点が二点ほどございます。
(質問1)
インディ・パさんが提供されている「Dynamic ARMS FX」に関するひまわり証券のオンデマンドセミナーで、「この商品が採用している統計解析モデルはARです」というくだりがあったかと存じます。
その後、時系列解析について調べてみたところ、時系列解析モデルには、ARモデルのみならず、ARとMAを組み合わせたARMAモデル、さらにARMAをより使いやすくしたARIMAモデルなるものが存在するということがわかりました。そこで質問です。
「Dynamic ARMS FX」で採用されているモデルは純粋にARということなのでしょうか?
(質問2)
最近のオンデマンドセミナー「マーケットの統計解析シリーズ 第4回」の中で紹介されていた「対数差分」に関することです。
統計解析の際に金融時系列データについては「対数差分」を取ることでそれを正規化することがとても重要だというお話でした。
これは時系列解析を進めるにあたり、各モデルをあてはめるデータに”定常性”があることが重要ということと同じ意味なのでしょうか。
”定常性”の定義を数式で示されても、正直よくわかっておりません。
対数差分をとる⇔定常性がある という認識でよいのでしょうか?
A:
こんにちは。
さて、ご質問の件、回答させていただきます。
1. ダイナミックアームズは純粋な自己回帰モデル(AR)を使用しています。
2. 回答としては、=と考えていただいて結構です。
金融データの分析で収益率(対数差分)をとることで、非定常的時系列データであっても定常的データであるとみなして先に進むという意味です。
講義では、ご承知の通り、「正規化」の方が、多方面で使用される一般的な用語であるため、わかりやすいかと思い、便宜的に使用させていただきました。

Q&Aの最終更新日 : 2010-07-14

統計解析フリーソフト「R」のデータフレーム作成の方法を教えてください。

Q:
前回はインディ・パが売買システムを開発される環境について教えていただきました。データマイニングの際に使用している統計ソフトについては「R」を利用されているとのことでした。そこで、私もにわかに「R」について勉強を始めました。『Rによるやさしい統計学』『Rで学ぶデータマイニング1』の2冊をテキストにしています。現時点で苦労しているのは、データフレームの作成に関するところです。上記2冊の中にもデータフレームの作成を解説するくだりはあるのですが、なかなか「わかった!」というところまで行きません。具体的には、ひまわり証券のトレードシグナルからエクセルに移した225先物の4本値をデータフレームとしたいのです。
データフレームの作成についてもっとよく書かれた「R」に関する参考書を別に買うべきか、あるいはインターネット上でその部分を詳しく学べる場所を訪れてみるべきか。本郷様のお知恵をお借りしたい場面です。以上よろしくお願いいたします。
A:
ご質問の件、以下のWebページを御覧下さい。
R でプログラミング:データの一括処理とグラフ描き
http://takenaka-akio.cool.ne.jp/doc/r_auto/index.html
1. 準備一般
http://takenaka-akio.cool.ne.jp/doc/r_auto/chapter_01.html
2. ひとつのファイルからデータを読み込む
http://takenaka-akio.cool.ne.jp/doc/r_auto/chapter_02.html
時系列のデータをExcelに貼り付けて、タブ区切りのテキスト形式に保存します。
その後、上に書かれている手順に従って、テキスト形式で保存したファイルを読み込めば、Rのデータフレームとして扱えます。
お役に立てれば幸いです。

Q&Aの最終更新日 : 2010-07-14

なぜFXでシステムトレードを行うのか?

Q:
今後、Dynamic ARMS 日経225先物といったようなパッケージを企画することはあるのでしょうか。なぜ、FX なのでしょうか。
A:
日経225は、以前から企画中です。
ただ、まだ統計解析段階なので、ロジックまでには至っておりません。
なぜFXかと申しますと、1番の理由は、流動性が大きいこと、2番目の理由は、今のロジックで統計的優位性が発揮しやすい市場であることのためです。

Q&Aの最終更新日 : 2010-07-14

統計解析フリーソフト「R」のデータフレーム作成の方法を教えてください。

Q:
セミナーの中で「統計的有意性」を非常に重視されていたように思われるのですが、それを検証する道具として、どのようなソフトをお使いなのでしょうか。
私が知っているのは、せいぜい「R」や「S-plus」といったころなのですが、これら以外に“使える”統計ソフトがあれば、是非ともご教示いただきたいです
弊社での開発は、C言語で直接書いて、DLLを使って検証しております。
ソフトを使う場合は、もっぱらフリーソフトの「R」を使用しております。
御承知の通り、ライブラリも充実しており、有用性が高いと考えております。
最近は、書籍も増えてきており、使い易い環境が整ってきています。
お役に立てば幸いです。

Q&Aの最終更新日 : 2010-07-14