MS-LIVE-OHLCV-BACKTEST-1-IMPL — Real-Data Result

Datum: 2026-06-04 (~19:00 UTC) Modus: Read-only Backtest auf historische MS-Dry-Run Candidates · 0× Order · 0× Code-Touch im Bot Datenquelle: Binance Public Spot API · 5-min OHLCV · 4 h Window pro Candidate Window: 2026-05-28 07:37 UTC → 2026-06-04 15:37 UTC


1. Executive Summary

MS-Live darf in der aktuellen Form NICHT aktiviert werden. Aggregat-Level versagen alle 6 Strategien die Akzeptanz-Schwellen. Aber: Symbol-Level zeigt klare Edge für TON, WLD, MEME, HBAR — kompensiert durch katastrophale False-Positives auf XPL, POL.

Empfehlung: weder Activate noch komplett Verwerfen — MS-CURATED-SYMBOL-ALLOWLIST-1 (P1, neuer Plan) prüfen, der MS-Live nur auf statistisch profitable Symbole zuläßt.


2. Datenbestand

Metrik Wert
TRADE_CANDIDATEs extrahiert 646
OHLCV-Fetches erfolgreich 646 (100 %)
Fetches fehlgeschlagen 0
Backtest-Window pro Candidate 4 h × 5 min = 48 Bars
Total Backtest-Laufzeit 207 s
Datenquelle Binance Public Spot

3. Aggregat-Ergebnisse pro Strategy

Variant A — RAW (alle 646 Candidates, kein Dedup)

Strategy N WR Exp % PF TP SL TO Verdict
trend_follow 620 38.55 % −0.241 0.856 13 47 560 NO_GO
breakout 23 0.00 % −2.144 0.0 0 3 20 DEFER (N<50)
volatility_sweep 3 0.00 % −0.494 0.0 0 0 3 DEFER (N<30)
mean_reversion 0 NO_DATA
vwap_mean_reversion 0 NO_DATA
oversold_bounce 0 NO_DATA

Variant B — POST-RECON (Dedup + Stablecoin-Block aktiv)

Dedup-Statistik: - 20 Candidates durch Stablecoin-Block weggefiltert - 413 durch SYM:120-min Cooldown weggefiltert - 144 durch SYMSTRAT:360-min Cooldown weggefiltert - 69 verbleibende Candidates (10.7 % des Original-Samples)

Strategy N WR Exp % PF Verdict
trend_follow 67 37.31 % −0.272 0.840 DEFER (N<100, ähnliche Edge wie RAW)
breakout 1 0.00 % −3.365 0.0 DEFER (N<<50)
volatility_sweep 1 0.00 % −0.347 0.0 DEFER (N<<30)

Verdict pro Strategy (kombiniert)

Strategy Akzeptanz-Schwelle RAW erreicht? POST_RECON erreicht? Final
trend_follow N≥100 / WR≥35% / Exp≥+0.3% / PF≥1.1 N ✓ WR ✓ Exp ✗ PF ✗ N ✗ NO_GO
breakout N≥50 ✗ (23) ✗ (1) DEFER — mehr Daten
volatility_sweep N≥30 ✗ (3) ✗ (1) DEFER — mehr Daten
mean_reversion N≥50 ✗ (0) ✗ (0) NO_DATA — Strategy hat nie ausgelöst
vwap_mean_reversion N≥50 ✗ (0) ✗ (0) NO_DATA — OFF default
oversold_bounce N≥30 ✗ (0) ✗ (0) NO_DATA — RSI<25-Gate zu strikt für aktuellen Markt

4. Regime-Slicing (RAW)

Regime N WR Exp % PF Timeout
STRONG_TREND 357 38.7 % −0.361 0.800 88.5 %
WEAK_TREND 286 35.3 % −0.244 0.841 92.0 %
RANGE 3 0.0 % −0.493 0.0 100.0 %
HIGH_VOL / CHOP 0

Befund: STRONG_TREND und WEAK_TREND verhalten sich sehr ähnlich (Edge gleichermaßen negativ). Regime ist kein primärer Edge-Treiber.


5. Symbol-Level Breakdown — der eigentliche Insight

Top-10-Symbole (RAW)

Symbol N WR % Exp % PF Total Net % Bewertung
TON/USDT 45 75.6 +2.136 4.639 +96.14 ✓ Premium
WLD/USDT 42 59.5 +2.064 2.092 +86.69 ✓ Premium
MEME/USDT 49 61.2 +0.846 1.753 +41.47 ✓ Stabil
HBAR/USDT 39 59.0 +0.820 3.057 +31.99 ✓ Stabil
ICP/USDT 41 56.1 +0.062 1.070 +2.53 – Grenzwertig
NEAR/USDT 36 52.8 −0.029 0.982 −1.05 – Neutral
XLM/USDT 36 27.8 −0.330 0.844 −11.88 ✗ Schwach
POL/USDT 29 10.3 −0.420 0.063 −12.19 ✗ Toxisch
FET/USDT 90 42.2 −0.209 0.876 −18.84 ✗ Toxisch
XPL/USDT 37 5.4 −3.134 0.003 −115.96 Katastrophal

Aggregat Top-10: −201 USDT net (von −200 total → Top-10 dominiert das Sample).

Kernerkenntnis: - 4 Symbole liefern +256 USDT kumuliert (TON+WLD+MEME+HBAR) - 4 Symbole liefern −159 USDT kumuliert (XPL+POL+FET+XLM) - XPL allein zerstört −116 USDT — das ist mehr als die Top-2 Gewinner kombiniert

Die MS-Strategy hat Edge auf Symbol-Level, aber das Sample-Level wird durch die Toxic-Symbols kannibalisiert.

Top-Symbole (POST-RECON, dedup-bereinigt)

Symbol N WR % Exp % PF
HBAR/USDT 2 100.0 +1.347 inf
ICP/USDT 4 75.0 +0.854 10.856
WLD/USDT 7 57.1 +2.821 3.24
TON/USDT 4 50.0 +1.719 2.47
NEAR/USDT 3 33.3 +0.412 1.642
XLM/USDT 4 25.0 +0.221 1.176
FET/USDT 9 33.3 −0.313 0.815
POL/USDT 3 33.3 −0.260 0.457
MEME/USDT 5 20.0 −1.442 0.202
XPL/USDT 4 25.0 −2.674 0.030

Nach Dedup sind die Sample-Größen je Symbol so klein, dass Aussagen schwach werden. Aber die Rangfolge bleibt erhalten: TON/WLD/ICP/HBAR top, XPL/MEME/POL bottom.


6. Overall PnL-Simulation

Variante N TP SL TIMEOUT WR Total Net %
RAW 646 14 50 582 37.0 % −200.35
POST_RECON 69 2 6 61 36.2 % −21.90

Bei 200 USDT Position-Size pro Trade ergäbe RAW ein theoretisches PnL von ~−400 USDT in 7 Tagen. POST-RECON ~−44 USDT in derselben Zeit — Dedup reduziert den Schaden 10×, aber nicht profitabel.


7. Timeout-Rate = strukturelles Problem

Metrik RAW POST_RECON
TIMEOUT-Rate 90.1 % 88.4 %

90 % aller Candidates erreichen weder TP noch SL binnen 4 Stunden. Die Strategy plant TP/SL zu eng (kleine ATR-Multiples) für die tatsächliche Marktvolatilität. Bei Timeout-Close zu Last-Price ist die MtM-Verteilung negativ-skew.

Implication: Strategy-Parameter (sl_atr_mult, tp_atr_mult) sind nicht real-data-tuned.


8. RAW vs POST-RECON Comparison

Aspekt RAW POST-RECON
Sample-Größe 646 69 (−89 %)
Total Net −200 % −22 %
Win-Rate 37.0 % 36.2 %
Expectancy −0.31 % −0.32 %
Trades pro Tag ≈ 93 ≈ 10
Verdict NO_GO NO_GO (zu klein für GO)

Befund: Dedup ändert die Per-Trade-Edge kaum (−0.31 vs −0.32 %). Es reduziert nur Frequency. Die strukturelle Edge-Schwäche bleibt.

REPEAT-CANDIDATE-DEDUP-1 schützt vor Frequenz-Bleeding, behebt aber nicht die TP/SL-Tuning-Lücke.


9. Empfehlung pro Strategy

Strategy Verdict Begründung Nächster Schritt
trend_follow NO_GO N=620 statistisch stark, aber Exp=−0.24% und PF=0.86 TP/SL-Re-Tuning + Symbol-Allowlist
breakout DEFER N=23 zu klein; 0 % Wins Mehr Markt-Daten (4 Wochen wait)
volatility_sweep DEFER N=3 unbrauchbar Re-eval bei N≥30
mean_reversion NO_DATA 0 Candidates in 9 d Strategy-Logic-Audit (RangeTrading-V1 zu strikt?)
vwap_mean_reversion NO_DATA 0 Candidates OFF — pre-existing-Erkenntnis
oversold_bounce NO_DATA RSI<25-Gate filtert allen Markt aus Strategy-Threshold-Lockerung erwägen

10. Empfohlene Folge-Phasen

ID Prio Zweck
MS-CURATED-SYMBOL-ALLOWLIST-1 P1 Allowlist {TON, WLD, MEME, HBAR, ICP} für MS-Live; alle anderen Symbole bleiben Dry-Run-only. Plan + 2-w-Monitor.
MS-TP-SL-RETUNING-1 P2 Per-Strategy ATR-Multiplier re-calibrate gegen tatsächliche MFE/MAE-Distribution aus diesem Backtest. Hauptziel: TIMEOUT-Rate < 50 %.
MS-WEEKLY-BACKTEST-RERUN-1 P3 Backtest weekly automatisch laufen lassen, in bot_statuses.metadata_json.ms_backtest_weekly exposen.
OVERSOLD-BOUNCE-RSI-RELAX-1 P3 Investigieren ob RSI<25-Gate ZU strikt ist (0 Hits in 9 d).
MS-LIVE-OHLCV-BACKTEST-1 done Audit + Implementation abgeschlossen, weitere Re-Runs als Sub-Phasen.

11. Limitierungen + Bias-Hinweise

# Limitierung Auswirkung
1 4-h Window — viele Candidates brauchen länger Timeout-Rate evtl. überzeichnet; 8-h-Run als Sensitivity nötig
2 Worst-Case-Modell SL-vor-TP bei gleichem Bar Echte Outcomes evtl. minimal besser (TP-First selten)
3 Mainnet-OHLCV vs Testnet-Execution Annahme: identische Spread-Strukturen; in Praxis kann Testnet-Slippage abweichen
4 Strategy-Defaults haben sich im Window geändert (RangeTrading-V1 ersetzte mean_reversion am 31.05) Phase-D-Daten für mean_reversion sind frühe Lifecycle
5 0.3 % Fee+Slippage konservativ Reale Costs könnten niedriger sein, aber Testnet-Slippage unklar
6 Cluster-Bias (TON 45 Hits in 2-h-Window) TON-Edge möglicherweise zeitlich-konzentriert nicht repräsentativ
7 TIMEOUT-MtM kann positiv/negativ je nach Bar-Close-Drift 90 % Timeout-Rate macht das zur dominierenden Komponente

12. Boundaries dieser Implementation

0× Bot-Code-Touch · 0× Trading-State-Touch · 0× Orders · 0× MS-Live-Aktivierung · 0× Mainnet · 0× Env-Änderung · 0× DB-Write · 0× Bot/Worker-Recreate · 0× ConfigProfile-Apply · 0× Push.

Erstellte Dateien (alle lokal in /tmp/ms_backtest): - candidates.json — 646 extrahierte Candidates - cache/ — 646 OHLCV-Snapshots - outcomes.csv — Per-Candidate Backtest-Outcomes - report.json — strukturiertes Aggregat - report.md (diese Datei) - PDF — separat publiziert


13. Operator-Entscheidung

Option Aktion
A GO MS-CURATED-SYMBOL-ALLOWLIST-1 PLAN (P1 neu) — restriktiv MS-Live auf TON/WLD/MEME/HBAR/ICP zulassen
B GO MS-TP-SL-RETUNING-1 PLAN (P2 neu) — Strategy-Parameter re-tunen
C Bundle A+B: Symbol-Allowlist + Re-Tuning kombiniert
D Idle — Dry-Run weiter, 2 w neue Daten sammeln, Re-Run
E MS komplett deaktivieren (MULTI_STRATEGY_ENABLED=false) — Legacy-Only-Mode

Default-Empfehlung: A (P1-Allowlist mit nachweislich profitablen Symbolen, geringes Risiko).


STOP

Backtest abgeschlossen, Roadmap-Update wird vorbereitet, kein Push, keine MS-Live-Aktivierung, kein Roadmap-Commit ohne separates Operator-GO.