楽天証券の口座でデイトレの自動売買に挑戦しようと、Windows / Excel 上で動作する マーケットスピード II RSS を利用した Python アプリ (Kabuto) を開発しています。今月は、来るゴールデン・ウィークに存分に強化学習モデルのバックテストができるように準備を進めています。
今日の日経平均株価
| 現在値 | 57,877.39 | +1,374.62 | +2.43% | 15:45 | |
|---|---|---|---|---|---|
| 前日終値 | 56,502.77 | 04/13 | 高値 | 57,979.82 | 11:11 |
| 始値 | 57,085.65 | 09:00 | 安値 | 57,010.18 | 09:02 |
※ 右の 15 分足チャートは Yahoo! Finance のデータを yfinance で取得して作成しました。
【関連ニュース】
- 米中古住宅販売、3月は3.6%減 在庫不足で9カ月ぶり低水準 | ロイター [2026-04-13]
- アンソロピック最新AI、米政府も恐れる「威力」-何がそこまで凄いか - Bloomberg [2026-04-14]
- 【欧州市況】国債下落、ホルムズ海峡封鎖を意識-ユーロは対円で上昇 - Bloomberg [2026-04-14]
- 米国株式市場=上昇、米・イラン協議決裂も緊張緩和に望みつなぐ | ロイター [2026-04-14]
- 【米国市況】株上昇、「イランから電話」とトランプ氏-原油上げ縮小 - Bloomberg [2026-04-14]
- ブルー・アウルのプライベートクレジット、債券市場で4億ドル調達 - Bloomberg [2026-04-14]
- ブラックロックのプライベートクレジット、融資先企業が初デフォルト - Bloomberg [2026-04-14]
- アングル:アンソロピック「ミトス」、AIでサイバー攻撃可能 銀行に脅威 | ロイター [2026-04-14]
- 【日本市況】日経平均1300円超高、停戦交渉期待で-金利が一転急低下 - Bloomberg [2026-04-14]
- 日経平均は反発、米イラン協議再開への期待 主力株がけん引 | ロイター [2026-04-14]
強化学習の沼
月末から始まるゴールデンウィークにゆっくりバックテストができそうなので、それまでにどれだけ強化学習モデルを育てられるかに挑んでみることにしました。
複数のティックデータで学習
観測値や報酬設計が不十分ですが、複数のティックデータで学習する体制を整えました。
試しに過去 20 日分のティックデータに対し、最初のティックデータは 50 エピソード、残りは 25 エピソードの学習を実施してみました。この程度の量であれば、低速な CPU でも半日ぐらいで処理を完了でき、学習曲線の大雑把な傾向はつかめるだろうと考えました。
過去 20 日分の学習における報酬 (episord_reward)、損益 (pnl)、約定回数トレンド (transactions)
TensorBorad で時系列にトレンドを確認すると、ばらつきはあるものの、報酬および収益を伸ばす方向に学習が進んでいません。
よくわからない状態で観測値(特徴量)を増やす前に、今のシンプルな観測空間で報酬設計に工夫する余地がないか、もう少し試行錯誤を続けます。
参考サイト
- マーケットスピード II RSS | 楽天証券のトレーディングツール
- マーケットスピード II RSS 関数マニュアル
- 注文 | マーケットスピード II RSS オンラインヘルプ | 楽天証券のトレーディングツール
- PythonでGUIを設計 | Qtの公式Pythonバインディング
- Python in Excel alternative: Open. Self-hosted. No limits.
- Book - xlwings Documentation


0 件のコメント:
コメントを投稿