Datum: 2026-06-04 (~19:30 UTC) Modus: Read-only Backtest mit 7-Tage-Hold-Window auf identische 646 MS-TRADE_CANDIDATEs Datenquelle: Binance Public Spot API · 5-min OHLCV mit Pagination · 7 d Window pro Candidate Operator-Direktive: Keine Coin-Allowlist/Denylist · nur Stablecoin/Peg-Block · 7d statt 4h
Das 7-Tage-Window enthüllt die wahre Performance der MS-Strategien — sie ist deutlich schlechter als der 4h-Window suggerierte. Der 4h-Window hatte 90 % TIMEOUTs zu Mark-to-Market geschlossen — viele dieser MtM-Werte standen bei hohem MFE, das in den Folgetagen umkippte.
| Metric | 4h-Window | 7d-Window | Δ |
|---|---|---|---|
| TP-Hits | 14 (2.2 %) | 169 (27.0 %) | +155 |
| SL-Hits | 50 (8.0 %) | 388 (62.0 %) | +338 |
| Timeouts | 582 (89.8 %) | 69 (11.0 %) | −513 |
| Win-Rate | 38.2 % | 30.5 % | −7.7 pp |
| Expectancy | −0.31 % | −1.56 % | 5× schlechter |
| Profit Factor | 0.819 | 0.656 | schlechter |
| Total Net % | −196 % | −978 % | 5× schlechter |
| Timeout-Rate | 89.8 % | 11.0 % | −78.8 pp |
Kern-Ergebnis: Das 4h-Window war eine systematische Schönfärberei. Die wahre Win-Rate ist 30.5 %, die wahre Edge ist klar negativ (−1.56 % je Trade netto). MS-Live bleibt deutlich NO-GO.
| Item | Wert |
|---|---|
| Candidates verarbeitet | 646 |
| OHLCV-Fetches erfolgreich | 646 (100 %) |
| Window pro Candidate | 7 Tage = 168 h |
| Bar-Interval | 5 min (paginated, max 5 pages × 1000 bars) |
| Total Backtest-Laufzeit | 341 s |
| Datenquelle | Binance Public Spot |
| Stablecoin-Block aktiv (RAW) | ja (20 Candidates blockiert) |
| Cooldown-Block (POST-RECON) | SYM 120 min + SYMSTRAT 360 min |
| Fee-Modell | TP/SL: 0.3 % · TIMEOUT_7D: 0.2 % |
| SL-vor-TP bei gleichem Bar | konservativ SL-HIT |
| 4h-Outcome | → 7d-Outcome | Count |
|---|---|---|
| TIMEOUT | → SL | 338 |
| TIMEOUT | → TP | 155 |
| TIMEOUT | → TIMEOUT_7D | 69 |
| SL | → SL | 50 |
| TP | → TP | 14 |
Was passiert mit den 582 4h-TIMEOUTs in 7d-Sicht? - 58 % (338) kippen zu SL — die Position hätte SL gerissen - 27 % (155) schaffen es zu TP - 12 % (69) bleiben TIMEOUT auch nach 7d (sehr drift-arme Symbole wie U/USDT)
Bei einer hypothetischen Live-Execution mit 7-Tage-Hold wären die meisten "scheinbar profitable" 4h-MtM-Positionen tatsächlich Verluste geworden.
| Strategy | N | WR | Avg-Win % | Avg-Loss % | Exp % | PF | TO % | Verdict |
|---|---|---|---|---|---|---|---|---|
| trend_follow | 600 | 31.2 % | +6.71 | −4.85 | −1.44 | 0.68 | 9.2 % | NO_GO |
| breakout | 23 | 4.3 % | +9.47 | −6.43 | −5.96 | 0.13 | 60.9 % | NO_GO |
| volatility_sweep | 3 | 100.0 % | +8.74 | — | +8.44 | ∞ | 0.0 % | DEFER (N=3) |
| mean_reversion | 0 | — | — | — | — | — | — | NO_DATA |
| vwap_mean_reversion | 0 | — | — | — | — | — | — | NO_DATA |
| oversold_bounce | 0 | — | — | — | — | — | — | NO_DATA |
trend_follow liefert über 600 Trades hinweg ein klares Negativ-Ergebnis. breakout ist mit nur 23 Trades zu klein, aber 4 % Win-Rate ist katastrophal. volatility_sweep N=3 → nicht aussagekräftig.
Dedup-Stats unverändert (gleiche Kandidaten, gleiche Regeln): - Stablecoin-Block: 20 - SYM-120m-Cooldown: 413 - SYMSTRAT-360m-Cooldown: 144 - Kept: 69
| Strategy | N | WR | Exp % | PF | Verdict |
|---|---|---|---|---|---|
| trend_follow | 67 | 32.8 % | −0.97 | 0.77 | DEFER (N<100) |
| breakout | 1 | 0.0 % | −3.36 | 0.0 | DEFER |
| volatility_sweep | 1 | 100.0 % | +8.72 | ∞ | DEFER |
Selbst Dedup rettet die Edge nicht.
(Nur Analyse pro Operator-Vorgabe, KEINE Allowlist/Denylist-Empfehlung)
| Symbol | 4h N | 4h Total | 4h WR | 7d N | 7d Total | 7d WR | 7d TP | 7d SL | 7d TO |
|---|---|---|---|---|---|---|---|---|---|
| TON/USDT | 45 | +96.14 % | 75.6 % | 45 | +155.18 % | 82.2 % | 37 | 8 | 0 |
| WLD/USDT | 42 | +86.69 % | 59.5 % | 42 | +341.62 % | 54.8 % | 22 | 16 | 4 |
| MEME/USDT | 49 | +41.47 % | 61.2 % | 49 | +11.80 % | 67.3 % | 12 | 13 | 24 |
| HBAR/USDT | 39 | +31.99 % | 59.0 % | 39 | −136.69 % | 17.9 % | 7 | 32 | 0 |
| ICP/USDT | 41 | +2.53 % | 56.1 % | 41 | −50.17 % | 43.9 % | 18 | 23 | 0 |
| FET/USDT | 90 | −18.84 % | 42.2 % | 90 | −98.83 % | 30.0 % | 27 | 63 | 0 |
| XLM/USDT | 36 | −11.88 % | 27.8 % | 36 | −294.76 % | 8.3 % | 3 | 29 | 4 |
| NEAR/USDT | 36 | −1.05 % | 52.8 % | 36 | −221.12 % | 5.6 % | 2 | 34 | 0 |
| XPL/USDT | 37 | −115.96 % | 5.4 % | 37 | −251.42 % | 0.0 % | 0 | 37 | 0 |
| POL/USDT | 29 | −12.19 % | 10.3 % | 29 | −6.27 % | 48.3 % | 14 | 15 | 0 |
| INJ/USDT | 26 | −22.11 % | 26.9 % | 26 | −71.30 % | 30.8 % | 8 | 4 | 14 |
| WLFI/USDT | 24 | −64.46 % | 0.0 % | 24 | −61.75 % | 0.0 % | 0 | 8 | 16 |
| ENA/USDT | 20 | −137.75 % | 0.0 % | 20 | −199.31 % | 0.0 % | 0 | 20 | 0 |
| TRUMP/USDT | 19 | −32.22 % | 0.0 % | 19 | −57.59 % | 0.0 % | 0 | 19 | 0 |
| ALGO/USDT | 16 | +17.75 % | 43.8 % | 16 | −87.75 % | 0.0 % | 0 | 16 | 0 |
| Pattern | Symbole |
|---|---|
| 4h positiv & 7d noch positiver | TON (+96→+155), WLD (+87→+342) |
| 4h positiv & 7d deutlich schwächer | MEME (+41→+12), HBAR (+32→−137), ICP (+3→−50), ALGO (+18→−88) |
| 4h grenzwertig & 7d klar negativ | NEAR (−1→−221), XLM (−12→−295), FET (−19→−99) |
| 4h negativ & 7d noch negativer | XPL (−116→−251), ENA (−138→−199), TRUMP (−32→−58), WLFI (−64→−62) |
| 7d besser als 4h | TON, WLD, POL (−12→−6), MEME etwas |
→ Längere Hold-Zeit ist strukturell ungünstig außer für ganz wenige Symbole. Aber selbst die Pattern-Stabilität von TON/WLD reicht nicht für eine harte Empfehlung (siehe MS-BACKTEST-RESULT-VERIFY-1 Cluster-Bootstrap P(loss) TON 9.5 % / WLD 19.4 %).
| Regime | N | WR | Exp % | PF |
|---|---|---|---|---|
| STRONG_TREND | 351 | 33.6 % | −1.30 | 0.71 |
| WEAK_TREND | 272 | 26.5 % | −1.83 | 0.61 |
| RANGE | 3 | 100.0 % | +8.44 | ∞ |
WEAK_TREND ist im 7d-Window schwächer als STRONG_TREND — vermutlich weil WEAK_TREND-Bewegungen häufiger drehen und SL ziehen.
| Variant | 4h TO % | 7d TO % | Δ |
|---|---|---|---|
| RAW total | 89.8 % | 11.0 % | −78.8 pp |
| POST_RECON total | 88.4 % | 11.0 % | −77.4 pp |
Strukturelle Auflösung: 89 % der 4h-TIMEOUTs werden im 7d-Window zu echtem TP oder SL. Das 4h-Fenster verbarg die echten Outcomes systematisch.
NEIN. Sample-weit verschlechtert sich Total Net von −196 % auf −978 %. Win-Rate sinkt von 38.2 % auf 30.5 %. Expectancy 5× schlechter. Pro Strategy: - trend_follow: Exp −0.24 % → −1.44 % (~6× schlechter) - breakout: Exp −2.14 % → −5.96 %
Auf Symbol-Level zeigen TON (+155) und WLD (+342) eine bessere Edge im 7d-Window. Aber das ist eine Symbol-spezifische Beobachtung, keine Strategy-Aussage — und im Aggregat klar negativ.
JA, sogar deutlicher als zuvor. Die Daten zeigen eindeutig: - Keine Strategy passt die Akzeptanz-Schwellen - 4h-Window war systematisch zu optimistisch - Wahre Edge ist negativ (sample-weit)
Differenziert: - Argument FÜR 7d-Time-Stop: 4h-Force-Close cuttet sowohl mögliche TPs (155 verpasste) als auch mögliche SLs (338 verschluckt). 7d gibt der Strategy mehr Raum zur Auflösung. Pure-Time-Stop bei 4h würde an Realität vorbeisteuern. - Argument GEGEN 7d-Time-Stop: Der überwältigend grosse Teil der echten Auflösungen ist SL-Hit (62 %, vs 27 % TP). Das heisst längeres Halten verstärkt vor allem Verluste — nicht Gewinne. - Operator-Trade-off: Aktuelle Strategie ist nicht profitabel genug, um die "länger halten"-Frage sinnvoll zu beantworten. Zuerst Strategy-Edge etablieren, dann Time-Stop diskutieren. - Hinweis: TIMEOUT_7D-Rate ist 11 % — also 7d wäre für die meisten Setups genug Auflösungszeit, ein Time-Stop NACH 7d (oder noch länger) wäre redundant.
Empfehlung: Time-Stop-Wahl darf nicht im Vakuum entschieden werden. Erst nach Strategy-Quality-Fix (z.B. MS-SIGNAL-QUALITY-FILTER-1) macht Time-Stop-Tuning Sinn.
| Strategy | Schwelle | Result 7d | Pass? |
|---|---|---|---|
| trend_follow (N=600) | N≥100 ✓ / WR≥35 % / Exp≥+0.3 % / PF≥1.1 | N=600 / WR=31.2 % / Exp=−1.44 % / PF=0.68 | NO auf 3 von 4 |
| breakout (N=23) | N≥50 | N=23 | NEIN (sample zu klein) |
| volatility_sweep (N=3) | N≥30 | N=3 | NEIN |
| mean_reversion | N≥50 | N=0 | NO_DATA |
| vwap_mean_reversion | N≥50 | N=0 | NO_DATA |
| oversold_bounce | N≥30 | N=0 | NO_DATA |
Verdict bleibt: NO_GO für alle 6 Strategien.
0× Bot-Code-Touch · 0× Trading-State · 0× Orders · 0× MS-Live · 0× Mainnet · 0× Env · 0× DB-Write · 0× ConfigProfile · 0× Bot/Worker-Recreate · 0× Push · 0× Roadmap-Commit.
Erstellte Dateien:
- outcomes_7d.csv — Per-Candidate 7d-Outcomes (646 Zeilen)
- report_7d.json — strukturiertes Aggregat
- cache_7d/ — 646 OHLCV-Snapshots (7d × 5min, ~2000 Bars je Candidate)
- diese Markdown- und PDF-Files
7d-Backtest abgeschlossen. Stärkster Beleg bisher, dass die MS-Strategien nicht profitabel sind. 4h-Window-Edge war ein Mark-to-Market-Artefakt. MS-Live bleibt NO_GO, keine Coin-Allowlist/Denylist empfohlen.
Operator-Entscheidung erforderlich für nächste Folge-Phase (MS-SIGNAL-QUALITY-FILTER-1 / MS-LIVE-OHLCV-BACKTEST-3 mit mehr Daten / Idle).