2026-06-17 · Research Harness · Claudestyle

NYAM OHLCV 統計分析研究

把現有 NQ / NYAM 1m OHLCV 資料先做成可驗證的研究底座,再評估 TimesFM 是否能提供 forecast error 或 regime feature 增益。

✅ 已驗證 · SQLite + rclone 已上傳

SSoT DB: nq-ict-scout/data/nq_ict_scout.db

Raw CSV: nq-ict-scout/data/raw/ · 雲端: gdrive:data/nyam-ohlcv/

HTML 目的:快速檢查資料、方法、同步與下一步。

主表 bars501,776ohlcv_1m
主表交易日3722025-01-02 → 2026-06-16
Databento bars483,657359 trade dates
Drive 已上傳275 MiBDB hash 驗證 0 diff

資料現況

資料表筆數工作日日期範圍判讀
ohlcv_1m501,7763722025-01-02 → 2026-06-16研究主表,TV/manual ingest 1m OHLCV。
ohlcv_databento483,6573592025-01-02 → 2026-06-05Databento 歷史/週批資料,符號 NQ.c.0
ohlcv_yfinance83,405632026-03-19 → 2026-06-16每日下載備援,符號 NQ=F

狀態說明:✅ 可驗證;⚠️ yfinance 僅適合備援與對照;Databento 應作為品質基準。

📍 資料位置(Raw Location)
本機 SSoT DB~/Documents/nq-ict-scout/data/nq_ict_scout.db三表全量 OHLCV(250 MB)
本機 Raw CSV~/Documents/nq-ict-scout/data/raw/9 個 databento CSV(1m + 15m,2025-01 → 2026-03)
本機備份~/Documents/nq-ict-scout/data/backups/6 份 DB 每日快照(1.4 GB,尚未上雲)
雲端備份gdrive:data/nyam-ohlcv/DB + raw/ + stats,275 MiB,2026-06-17 上傳,rclone check 0 diff

Google Drive 同步

✅ 已上傳 · rclone

目標:gdrive:data/nyam-ohlcv/

2026-06-17 已上傳 12 物件 / 275 MiB(DB 一致快照 + raw CSV + stats)。rclone check 對 DB hash 比對 0 diff。1.4 GB 歷史備份尚未上雲。

⚠️ 不推薦主用 · gws

gws 已安裝,但自檢顯示授權/Discovery 不穩。資料檔同步用 rclone 更直接。

資料管線

SourceDatabento / TV ingest / yfinance
Schema CheckOHLCV 欄位、timestamp、trade_date
Quality Scan缺口、異常值、重複、DST
Featuresreturn、range、ATR、volume z-score
TestsBus Terminal × NYAM state
Findingsexpectancy、CI、leakage audit

方法矩陣

✅ 統計

描述統計

分布、range、return、volume profile。先回答資料長什麼樣。

✅ 統計

Walk-forward classifier

用 session-level label 測 state 是否提升 conditional expectancy。

⚠️ 風險

Leakage audit

每個 feature timestamp 必須早於 prediction timestamp。

⚠️ 風險

Bootstrap CI

避免只看 hit rate;檢查 expectancy 是否穩定。

ℹ️ TimesFM

Forecast baseline

先和 naive baseline 比,不直接當多空裁判。

ℹ️ TimesFM

Forecast error feature

市場偏離預測時,作為 regime 或 anomaly 特徵。

泳道流程

Data
✅ DB count
✅ raw CSV
⚠️ source align
⚠️ DST audit
ℹ️ snapshot
Stats
✅ bars/days
⚠️ NYAM window
⚠️ features
ℹ️ bootstrap
ℹ️ lift test
Visualization
✅ report shell
ℹ️ filters
ℹ️ linked evidence
ℹ️ export hooks
⚠️ QA
Review
✅ sources
⚠️ TimesFM docs
⚠️ no leakage
ℹ️ cross-review
ℹ️ publish

發現與證據

✅ 已驗證

資料量足夠做 baseline

先做統計與狀態標籤,不急著模型化。

✅ 已上傳

OHLCV 已上雲備份

rclone 比 gws 更適合檔案同步。

⚠️ 待複核

TimesFM 應延後

先當 benchmark / forecast error feature。

主 DB 已有 501,776 根 1m bars、372 個交易日;可支撐 6-12 個月 retrospective harness。

研究里程碑

✅ 已驗證

資料盤點

DB / raw CSV / 表筆數。

✅ 已上傳

Drive 備份

rclone copy 275 MiB,hash 0 diff。

⚠️ 下一步

NYAM canonical

固定 ET 09:30-10:59 六根 15m bars。

⚠️ 下一步

State labels

trend / sweep reversal / range chop。

ℹ️ 第二階段

TimesFM 2.5

forecast baseline 與 error feature。

ℹ️ 第二階段

Review

bootstrap CI、leakage audit、publication。