2026-06-17 · Research Harness · Claudestyle
NYAM OHLCV 統計分析研究
把現有 NQ / NYAM 1m OHLCV 資料先做成可驗證的研究底座,再評估 TimesFM 是否能提供 forecast error 或 regime feature 增益。
主表 bars501,776ohlcv_1m
主表交易日3722025-01-02 → 2026-06-16
Databento bars483,657359 trade dates
Drive 已上傳275 MiBDB hash 驗證 0 diff
資料現況
| 資料表 | 筆數 | 工作日 | 日期範圍 | 判讀 |
|---|---|---|---|---|
ohlcv_1m | 501,776 | 372 | 2025-01-02 → 2026-06-16 | 研究主表,TV/manual ingest 1m OHLCV。 |
ohlcv_databento | 483,657 | 359 | 2025-01-02 → 2026-06-05 | Databento 歷史/週批資料,符號 NQ.c.0。 |
ohlcv_yfinance | 83,405 | 63 | 2026-03-19 → 2026-06-16 | 每日下載備援,符號 NQ=F。 |
狀態說明:✅ 可驗證;⚠️ yfinance 僅適合備援與對照;Databento 應作為品質基準。
📍 資料位置(Raw Location)
| 本機 SSoT DB | ~/Documents/nq-ict-scout/data/nq_ict_scout.db | 三表全量 OHLCV(250 MB) |
| 本機 Raw CSV | ~/Documents/nq-ict-scout/data/raw/ | 9 個 databento CSV(1m + 15m,2025-01 → 2026-03) |
| 本機備份 | ~/Documents/nq-ict-scout/data/backups/ | 6 份 DB 每日快照(1.4 GB,尚未上雲) |
| 雲端備份 | gdrive:data/nyam-ohlcv/ | DB + raw/ + stats,275 MiB,2026-06-17 上傳,rclone check 0 diff |
Google Drive 同步
資料管線
SourceDatabento / TV ingest / yfinance
Schema CheckOHLCV 欄位、timestamp、trade_date
Quality Scan缺口、異常值、重複、DST
Featuresreturn、range、ATR、volume z-score
TestsBus Terminal × NYAM state
Findingsexpectancy、CI、leakage audit
方法矩陣
✅ 統計
描述統計
分布、range、return、volume profile。先回答資料長什麼樣。
✅ 統計
Walk-forward classifier
用 session-level label 測 state 是否提升 conditional expectancy。
⚠️ 風險
Leakage audit
每個 feature timestamp 必須早於 prediction timestamp。
⚠️ 風險
Bootstrap CI
避免只看 hit rate;檢查 expectancy 是否穩定。
ℹ️ TimesFM
Forecast baseline
先和 naive baseline 比,不直接當多空裁判。
ℹ️ TimesFM
Forecast error feature
市場偏離預測時,作為 regime 或 anomaly 特徵。
泳道流程
Data
✅ DB count
✅ raw CSV
⚠️ source align
⚠️ DST audit
ℹ️ snapshot
Stats
✅ bars/days
⚠️ NYAM window
⚠️ features
ℹ️ bootstrap
ℹ️ lift test
Visualization
✅ report shell
ℹ️ filters
ℹ️ linked evidence
ℹ️ export hooks
⚠️ QA
Review
✅ sources
⚠️ TimesFM docs
⚠️ no leakage
ℹ️ cross-review
ℹ️ publish
發現與證據
✅ 已驗證
資料量足夠做 baseline
先做統計與狀態標籤,不急著模型化。
✅ 已上傳
OHLCV 已上雲備份
rclone 比 gws 更適合檔案同步。
⚠️ 待複核
TimesFM 應延後
先當 benchmark / forecast error feature。
主 DB 已有 501,776 根 1m bars、372 個交易日;可支撐 6-12 個月 retrospective harness。
研究里程碑
✅ 已驗證
資料盤點
DB / raw CSV / 表筆數。
✅ 已上傳
Drive 備份
rclone copy 275 MiB,hash 0 diff。
⚠️ 下一步
NYAM canonical
固定 ET 09:30-10:59 六根 15m bars。
⚠️ 下一步
State labels
trend / sweep reversal / range chop。
ℹ️ 第二階段
TimesFM 2.5
forecast baseline 與 error feature。
ℹ️ 第二階段
Review
bootstrap CI、leakage audit、publication。