NI #1 – ¿Acertar el momento o permanecer invertido?

Nota de inversión #1

¿Qué resulta más rentable a largo plazo: intentar anticipar los momentos de entrada y salida del mercado o permanecer invertido de forma continuada?

Para aproximar una respuesta, se plantea un ejercicio teórico: asumir el mejor market timing posible, invirtiendo en el punto de menor valoración histórica y desinvirtiendo en el máximo.

Con datos del profesor Robert Shiller, este escenario comenzaría en diciembre de 1920, con una ratio CAPE de 4,78 veces, y finalizaría en diciembre de 1999, en el pico de la burbuja puntocom, con una valoración de 44,20 veces. La ratio CAPE compara el precio con los beneficios medios de los últimos diez años ajustados a la inflación y se utiliza como referencia de valoración a largo plazo.

En ese periodo de 79 años, la rentabilidad real total —incluyendo dividendos y ajustada por inflación— habría sido del 8,77% anual. La descomposición de dicha rentabilidad permite distinguir dos componentes:

  • Market timing (2,85%): derivado de la expansión de múltiplos entre el punto de entrada y salida.
  • Time in the market (5,75%): generado por el crecimiento de beneficios y la distribución de dividendos (reinvertidos).

Incluso bajo este supuesto extremo, la mayor parte de la rentabilidad no proviene de la variación en las valoraciones, sino de la generación sostenida de resultados por parte de las empresas.

La implicación es directa: a largo plazo, la rentabilidad de la inversión en renta variable está más vinculada a la evolución de los beneficios que a la capacidad de anticipar movimientos de mercado.

Descargo de responsabilidad
  • Responsabilidad sobre los cálculos y posibles errores
    Cualquier error de cálculo, aproximación metodológica o interpretación numérica presente en este análisis es responsabilidad exclusiva del autor. Este documento tiene fines exclusivamente divulgativos y no constituye asesoramiento financiero ni garantía de exactitud absoluta.

  • Rentabilidades pasadas no garantizan resultados futuros
    El periodo 1920–1999 representa una fase extraordinariamente favorable para el mercado estadounidense. No existe evidencia de que los retornos históricos asociados al crecimiento de beneficios empresariales y la reinversión de dividendos se mantengan constantes en el futuro, ni en magnitud ni en estabilidad.

  • Sesgo de supervivencia y representatividad del mercado
    El análisis se basa implícitamente en el S&P 500, que refleja únicamente a las compañías más grandes y exitosas de Estados Unidos. Esto introduce sesgo de supervivencia, al excluir empresas que desaparecieron, así como la posible divergencia de otros mercados internacionales que no replicaron el mismo desempeño estructural.

  • Exclusión de costes, impuestos y fricciones de mercado
    Las rentabilidades citadas son teóricas y brutas. No incorporan comisiones de intermediación, costes de gestión, spreads, ni fiscalidad sobre plusvalías o dividendos. En la práctica, estos factores reducen de forma material la rentabilidad neta obtenida por el inversor.

  • Riesgo de comportamiento y horizonte temporal
    El modelo asume una inversión pasiva perfecta durante un periodo de 79 años, algo incompatible con el comportamiento real de los inversores. La volatilidad, las crisis financieras y los sesgos conductuales pueden inducir decisiones de compra y venta subóptimas, no reflejadas en datos históricos reconstruidos ex post.

  • Limitaciones del CAPE como indicador de timing
    La Cyclically Adjusted Price-to-Earnings (CAPE) es un indicador de valoración de largo plazo, no una herramienta de predicción de corto plazo. Su capacidad explicativa sobre movimientos de mercado en horizontes inferiores a 5–10 años es limitada, por lo que no debe interpretarse como señal operativa de entrada o salida del mercado.

32 Me gusta

Obviamente, en Diciembre de 1999 ambos CAGR coincidían no? ¿Qué le hace pensar eso? :smiley:

4 Me gusta

Interesante ejercicio y conclusiones. Gracias @Ruben1985

Posiblemente el ejercicio con el que más inversores particulares se puedan identificar, y creo se ha exhibido ya por estos foros -recuerdo leer uno hace años-, es el de simular dos procesos y aventuras de inversión. Uno invierte todo al principio y el otro compra en lo más bajo y vende en lo más alto, manteniéndose desinvertido el resto del tiempo. Es decir, Buy & Hold vs Market Timing.

Idealmente este segundo estilo, el Market Timing, podría ajustarse al gusto del usuario. Es decir, que por ejemplo cuando el mercado no esté en su mínimo o máximo de valoración (ya sea este medido en puntos de índice, o bien en un múltiplo de nuestro agrado), el inversor en cuestión se mantenga invertido, pongamos, al 50%. O bien poder incorporar lo que podríamos denominar un hesitation lag, o retraso por indecisión. A saber, que cuando el mercado toca máximos o mínimos, el inversor no vende o compra inmediatamente, sino que aguarda a ver si tal nivel es efectivamente el mínimo o máximo, y unos días después toma la decisión de invertir o desinvertir.

No debe de ser muy difícil de construir esta herramienta, que yo por desgracia por tener otros proyectos entre manos no haré. Me digo si la IA puede ya arrojar resultado fidedignos en este sentido. @Buso, si vd está suscrito a una versión de pago de alguna IA, yo me presto a darle los prompts. No tengo claro, no obstante, que las IAs tengan acceso a todas las series temporales -no sólo la cotización del índice, sino ratios como P/E- de forma totalmente precisa.

En todo caso, si alguien recuerda aquel ejercicio/simulación que se publicó por aquí hace años y tiene a bien ponernos el enlace, agradecido queda.

7 Me gusta

Saludos cordiales, @Amat.

Dice que

Eso es muy difícil. ¿Vd. también ve un montón de mínimos en los que comprar y un montón de máximo en los que vender?

Hay quien utiliza medias largas y, claro, de retrasa mucho. Hay quien utiliza cruces de medias largas con cortas ambas con el mismo sentido. Llegan tarde.

Ya dice Vd.:

Ese ‘de’ espresa duda.

No, no lo estoy. Yo uso la IA cuando no tengo ganas de revisar datos confiando en que lo haga bien la IA, pero ChatGPT en su versión gratuita lo hace francamente mal. También cuando tengo que escribir algo sobre lo que la IA busca mucha información y escribe acertadamente.

Como seguro que sabe, se ofrecen pruebas de versiones de las que afirman que son la versión prémium.

La IA Claude dice:

Buena pregunta, y la respuesta es matizada: sí, se han encontrado patrones, pero con importantes asteriscos. Aquí el panorama real:


¿Qué ha logrado la IA en esto?

:white_check_mark: Lo que sí funciona (con evidencia)

Reconocimiento de patrones técnicos
Modelos de IA combinan indicadores como MACD, RSI, Bandas de Bollinger y detección de patrones de velas japonesas para predecir tendencias de mercado. Esto es básicamente lo que hacía el análisis técnico tradicional, pero a escala masiva y automáticamente.

Modelos híbridos con alta precisión en backtests
Modelos híbridos de deep learning que integran CNNs y GRUs han demostrado capacidad para capturar dependencias temporales y relaciones complejas en la predicción de precios.

Transformers superando a redes neuronales clásicas
Los modelos transformer pueden captar patrones de largo plazo y estacionalidad, lo que permite predecir retornos bursátiles con mayor precisión que modelos anteriores. Pueden incorporar variables macroeconómicas como inflación, índices de volatilidad e incertidumbre de política económica.

Datos alternativos
Sistemas de IA analizan datos alternativos como imágenes satelitales de aparcamientos de centros comerciales, patrones de gasto con tarjeta de crédito y sentimiento en redes sociales para anticipar movimientos antes de que aparezcan en los precios.


:warning: El problema fundamental: la paradoja del éxito

Los mercados son reflexivos: los precios se mueven no solo porque cambia la información, sino porque los inversores reaccionan a las expectativas de los demás. Una vez que un patrón predictivo es ampliamente adoptado, su ventaja suele erosionarse.

A medida que más capital emplea estrategias de IA similares, el propio mercado cambia en respuesta, potencialmente invalidando los patrones que estos sistemas fueron diseñados para explotar.


:bank: Quién lo usa realmente con éxito

Los grandes fondos cuantitativos como Renaissance Technologies, Two Sigma o D.E. Shaw llevan décadas usando machine learning con retornos extraordinarios, pero guardan sus modelos como secretos industriales. Jeff Shen, co-CIO de BlackRock, lo resume bien: “La IA construye sobre la inversión cuantitativa tradicional ayudándonos a modelar relaciones más complejas en los datos. Pero la tecnología es un habilitador, no un sustituto. El juicio humano sigue siendo central.”


:police_car_light: Los riesgos reales

Los modelos tradicionales a menudo terminan ajustándose al ruido en lugar de las tendencias reales, lo que lleva a predicciones inexactas. El overfitting ocurre cuando un modelo se vuelve demasiado especializado en los datos de entrenamiento, perdiendo capacidad de generalizar en escenarios no vistos.

Cuando múltiples sistemas de IA detectan las mismas señales de riesgo simultáneamente, su venta concurrente puede agravar las caídas del mercado más allá de lo que justificarían los fundamentos. (El flash crash de 2010 y otros episodios similares son ejemplos.)


Conclusión práctica

Aspecto Realidad
¿Existen patrones? Sí, pero son temporales y se degradan
¿Funcionan en producción? En manos de fondos sofisticados, sí
¿Funcionan para el inversor retail? Resultados muy mixtos
¿Predicen máximos/mínimos exactos? No con consistencia fiable

La IA es muy buena identificando probabilidades estadísticas de que un activo esté sobrevendido o sobrecomprado, pero nadie ha resuelto el problema de predecir techos y suelos con precisión consistente. Si existiera un sistema así con alfa sostenido, el propio capital que fluiría hacia él eliminaría la ventaja.

6 Me gusta

Hablando un poco de mi libro… En este contexto, resulta especialmente interesante analizar los puntos de giro y las regularidades históricas asociadas a ellos. En las estrategias de entrada y salida basadas en momentum, estos episodios son especialmente relevantes, porque un filtro que ha ofrecido buenos resultados en el pasado puede perder eficacia o dejar de ser óptimo cuando cambia la estructura del mercado, hay múltiples papers que observan como han cambiado a lo largo de los años.

Mi hipótesis es que la forma en que hoy se genera, distribuye y procesa la información difiere sustancialmente de la de décadas anteriores y este no será el final, se seguirá avanzando de la misma manera con mayor acceso a la información como un objetivo constante, al igual que se avanza hacia la obtención de mayor energía. La velocidad con la que se difunden las narrativas de mercado, la transformación de los canales informativos y el uso creciente de la IA podrían estar reduciendo aún más la persistencia de determinadas ineficiencias ( como por ejemplo los factores ) o, al menos, acelerando la incorporación de información a los precios. Si esto es así, en el extraño caso que ciertas señales o métricas que antes pudiesen ofrecer cierta ventaja tengan ahora una vida útil más corta o una capacidad predictiva más inestable.

19 Me gusta

¿Creen que quedó satisfecho un señor que decidió permanecer 100% en RV tras ver una conclusión como esa, si luego le tocó salirse dos años y medio mas tarde en 2002 con menos de la mitad?

Quizás marchó en paz pensando que sólo fue un error estadístico. o quizás pensó que el cinismo máximo fue que la industria usara para vendernos que no importa cuándo entramos o salimos justo el libro “Exuberancia Irracional”, donde Shiller advertía que para un mercado con valoraciones tan extremas su retorno esperado para la siguiente década sería cercano a cero o negativo.

Vamos, usar una alerta de incendio para convencernos de que nos quedemos sentados mientras arde nuestra casa quizás no es solo un error de cálculo, sino el monumento definitivo al conflicto de interés de quienes cobran su comisión mientras vemos cómo nuestra jubilación puede llegar a convertirse en otro simple error estadístico.

Quizás es como el otro famoso estudio de qué rentabilidad anualizada se hubiera perdido sin los 10 mejores días en RV, sin tampoco tener en cuenta cuál hubiera sido evitando los 10 peores, etc…

Obvio tampoco abogo por la arrogancia de hacer MT, ya que estudios de Investment Gap como los de SPIVA, DALBAR o Moriningstar, etc… son una cura de humildad:y confirman que el market timing es casi imposible no porque el mercado sea perfecto, sino porque nosotros somos emocionalmente imperfectos.

Pero si abogo por la prudencia y por no dejar de tener en cuenta posibles incentivos ajenos, ya que puede que no tener en cuenta ya no sólo las valoraciones, sino sobre todo el perfil y horizonte temporal de cada uno sea igualmente una temeridad.

S2

18 Me gusta

Al leer sobre el Cruce Dorado pienso que quizás a alguien le resulte de interés una estrategia muy sencilla sobre el SP500. Operando a cierre de cada mes.

Entrar si el precio está por encima del precio del mes anterior y del precio de hace tres meses.

Salir si no hay señal de compra y el precio está por debajo de los precios de hace 6 y 12 meses.

Estas reglas son extremadamente simples y de una lógica evidente. Se compra si el mercado sube y se vende si baja.

No se necesitan medias ni ningún otro calculo técnico. Solo los rendimientos a 1, 3, 6 y 12 meses, cosa que encuentro muy fácilmente en mi banco.

No les doy resultados, pero quien se moleste en calcularlos creo que quedará sorprendido.

¿Seguirá funcionando igual de bien en el futuro? Quién sabe.

6 Me gusta

Saludos.

¿̶P̶u̶e̶d̶e̶n̶ ̶d̶e̶s̶p̶e̶j̶a̶r̶m̶e̶ ̶e̶s̶t̶a̶ ̶d̶u̶d̶a̶?̶ ̶¿̶S̶i̶ ̶c̶o̶m̶p̶r̶a̶m̶o̶s̶ ̶u̶n̶ ̶f̶o̶n̶d̶o̶ ̶o̶ ̶u̶n̶ ̶E̶T̶F̶ ̶i̶n̶d̶e̶x̶a̶d̶o̶ ̶a̶l̶ ̶S̶&̶P̶-̶5̶0̶0̶ ̶o̶ ̶a̶l̶ ̶I̶b̶e̶x̶-̶3̶5̶ ̶o̶ ̶a̶ ̶c̶u̶a̶l̶q̶u̶i̶e̶r̶ ̶í̶n̶d̶i̶c̶e̶ ̶q̶u̶e̶ ̶n̶o̶ ̶i̶n̶c̶l̶u̶y̶e̶ ̶d̶i̶v̶i̶d̶e̶n̶d̶o̶s̶ ̶e̶l̶ ̶f̶o̶n̶d̶o̶ ̶o̶ ̶e̶l̶ ̶E̶T̶F̶ ̶l̶o̶s̶ ̶i̶n̶c̶l̶u̶y̶e̶ ̶o̶ ̶q̶u̶é̶ ̶h̶a̶c̶e̶ ̶c̶o̶n̶ ̶e̶l̶l̶o̶s̶?̶ ̶¿̶H̶a̶y̶ ̶E̶T̶F̶ ̶i̶n̶d̶e̶x̶a̶d̶o̶s̶ ̶a̶l̶ ̶í̶n̶d̶i̶c̶e̶ ̶T̶R̶?̶ ̶O̶t̶r̶o̶s̶ ̶í̶n̶d̶i̶c̶e̶s̶ ̶c̶o̶m̶o̶ ̶e̶l̶ ̶D̶A̶X̶X̶ ̶s̶i̶ ̶i̶n̶c̶l̶u̶y̶e̶n̶ ̶d̶i̶v̶i̶d̶e̶n̶d̶o̶s̶?̶

P. ej., miren qué tristeza da el Ibex-35 (sin dividendos) desde enero de 2002 a octubre de 2022:

1 me gusta

Respuesta: los incluyen los fondos de acumulación y los ETF. No hay ETF de distribución.

2 Me gusta

Estimado @Toti,
no cree que le puede convenir más tener simplemente un porcentaje en bonos que estar operando sin saber cual será el resultado exacto? Qué maravilla no tener que perder el tiempo yo con cosas como esta.

Estrategia CAGR Vol Sharpe Sortino MaxDD Calmar
100% S&P 500 TR 11.24% 17.92% 0.529 0.675 -55.3% 0.203
70/30 SPX + Bonos 10 años 9.71% 12.39% 0.586 0.757 -40.7% 0.239
Momentum dual 9.88% 13.66% 0.555 0.654 -34.8% 0.284

Le pongo un análisis detallado de lo que comenta.

Momentum dual sobre S&P 500 TR · histórico completo 1988-2026 · revisión crítica

1. Contexto y reglas

  • Entrada: P_t > P_{t-21d} Y P_t > P_{t-63d} (precio por encima del de hace 1m y 3m).
  • Salida: NO entrada Y P_t < P_{t-126d} Y P_t < P_{t-252d} (precio por debajo del de hace 6m y 12m).
  • Máquina de estados: plano/largo; mantiene estado si no hay señal.
  • Ejecución al cierre siguiente (desfase 1 día, sin look-ahead).
  • Subyacente: ^SP500TR (S&P 500 con dividendos reinvertidos), desde 1988-01-04.
  • Cash: T-bill 3m ^IRX compuesto diariamente.
  • Costes: 5 bps por cambio de posición.

2. Resultados globales (37.28 años)

Métrica Estrategia Buy & Hold TR
CAGR 9.88% 11.25%
Volatilidad 13.66% 17.92%
Sharpe (excess) 0.555 0.530
Sortino 0.654 0.676
Max Drawdown -34.81% -55.25%
Fecha Max DD 2003-03-31 2009-03-09
Calmar (CAGR/ MaxDD )
% tiempo invertido 86.4% 100%
Cambios de posición 101

3. Gráficos

3.1 Curva de capital (log, 1988-2026)

3.2 Drawdowns (underwater plot)

La línea naranja (estrategia) evita las dos grandes simas del buy & hold: dot-com (2000-2002) y gran crisis financiera (2007-2009). En el resto, los dos perfiles son similares.

3.3 Exposición al mercado

3.4 Retorno rolling 12 meses

3.5 Distribución mensual

3.6 Retornos por año calendario


4. Análisis por subperiodos (donde está la clave)

Periodo CAGR Estrat CAGR BH Sharpe S Sharpe BH MaxDD S MaxDD BH
2000-2002 dot-com -7.50% -14.58% -0.79 -0.71 -25.2% -47.4%
2003-2007 alcista 10.16% +12.85% 0.61 0.76 -14.1% -13.8%
2008-2009 GFC +5.33% -10.76% +0.42 -0.17 -12.9% -51.8%
2010-2019 post-GFC 8.62% +13.58% 0.64 0.90 -28.3% -19.4%
2020-2026 COVID+ 6.77% +14.54% 0.33 0.63 -27.3% -33.8%

Aquí está la historia real: la estrategia gana batallas decisivas en 2000-2002 y 2008-2009 (ahorra >40 pp de drawdown en la GFC), pero pierde batallas de desgaste en los mercados alcistas largos. Su valor añadido depende críticamente de la presencia de bear markets prolongados.


4.bis Análisis rolling 10 años (327 ventanas mensuales)

Para cada fecha, calculo las métricas sobre los 10 años previos, avanzando mensualmente. Es el test más estricto de robustez temporal.

Caveat estadístico importante: las 327 ventanas mensuales están masivamente solapadas — ventanas consecutivas comparten 9 años y 11 meses de datos. Por tanto, los porcentajes siguientes son descriptivos, no una inferencia estadística. De forma estrictamente independiente solo caben ~3 ventanas no solapadas en 37 años (1988-1998, 1998-2008, 2008-2018, 2018-2026 parcial).

Métrica % ventanas donde Estrat > BH
CAGR estrategia > CAGR BH 52.6%
Sharpe estrategia > Sharpe BH 71.3%
MaxDD estrategia menos negativo que BH 90.2%

Diferencias medias: ΔCAGR -0.72 pp · ΔSharpe +0.027 · ΔMaxDD +13.88 pp (a favor de la estrategia).
Rango de ΔCAGR: entre -7.36 pp (ventanas terminadas ~2026) y +6.93 pp (ventanas terminadas ~2010).

Nota: aunque el 52.6% de ventanas tienen CAGR superior, la media de la diferencia es negativa (-0.72 pp). Esto significa que cuando la estrategia gana, gana poco, y cuando pierde, pierde más. Asimetría consistente con un perfil de seguro.

Rolling 10y — CAGR, Sharpe y MaxDD a lo largo del tiempo

Distribución de diferencias

Muestra cada ~3 años

Ventana termina CAGR Strat CAGR BH ΔCAGR Sharpe S Sharpe BH MaxDD S MaxDD BH
1998-12 18.92% 19.24% -0.3 1.00 0.99 -19.2% -19.2%
2002-01 13.87% 13.12% +0.8 0.68 0.58 -19.2% -35.7%
2005-01 13.10% 11.77% +1.3 0.66 0.50 -34.8% -47.4%
2008-01 6.66% 5.40% +1.3 0.29 0.19 -34.8% -47.4%
2011-01 5.79% 1.72% +4.1 0.35 0.09 -29.3% -55.3%
2014-01 8.01% 7.15% +0.9 0.52 0.37 -28.3% -55.3%
2017-01 6.26% 7.14% -0.9 0.46 0.40 -28.3% -55.3%
2020-01 8.60% 13.55% -5.0 0.64 0.90 -28.3% -19.4%
2023-01 7.36% 12.63% -5.3 0.54 0.72 -27.3% -33.8%
2026-01 8.94% 15.69% -6.8 0.53 0.78 -27.3% -33.8%

Patrón claro: la estrategia gana en las ventanas que incluyen dot-com o GFC (ventanas terminadas 2002-2014) y pierde en las dominadas por post-GFC y post-COVID (ventanas terminadas 2017-2026). El periodo gris sombreado en los gráficos (ventanas con GFC reciente) muestra la era dorada de la estrategia.

Lectura honesta: la ventaja en CAGR no es sistemática en el tiempo — depende del régimen. La ventaja en Sharpe (71%) y MaxDD (90%) sí es muy consistente. Esto confirma que la estrategia es una máquina de reducir riesgo, no una máquina de generar alpha en retorno absoluto.


5. Robustez: 64 combinaciones de ventanas

5.1 Top 5 por Sharpe

Entrada Salida CAGR Vol Sharpe Sortino MaxDD Calmar Ops
21 & 42 d 63 & 189 d 11.32% 13.14% 0.668 0.813 -29.84% 0.38 105
42 & 126 d 63 & 189 d 10.97% 12.58% 0.667 0.786 -22.29% 0.49 65
63 & 126 d 63 & 189 d 10.88% 12.49% 0.665 0.777 -21.97% 0.50 73
21 & 252 d 63 & 189 d 10.54% 12.50% 0.642 0.746 -27.16% 0.39 79
21 & 252 d 63 & 252 d 10.85% 13.23% 0.635 0.729 -31.44% 0.35 45

La variante original (21&63 / 126&252) queda en un puesto intermedio con Sharpe 0.555.

5.2 Recuento vs Buy & Hold

Criterio Cuántas superan al BH
CAGR > 11.25% 1 / 64
Sharpe > 0.530 52 / 64
MaxDD menos negativo que -55.25% 64 / 64

Contraste con el backtest de 15 años: allí solo 3/64 superaban el Sharpe. Con muestra completa, 52/64 lo hacen. La lógica de la estrategia es robusta al parámetro en horizonte largo.

5.3 Mapa riesgo-retorno

La nube de puntos está claramente a la izquierda del buy & hold (DD menor) y la mayoría queda por encima de él en Sharpe (colores amarillo-verde).


6. Test de significancia

Bootstrap por bloques (bloque = 21 días) con 5 000 iteraciones:

Estadístico Valor
Diferencia CAGR (Estrat − BH) -1.37%
IC 95% bootstrap [-5.05%, +1.33%]
p-value 0.234

La diferencia de CAGR NO es estadísticamente significativa en la muestra completa. En otras palabras: con los datos disponibles no podemos afirmar que la estrategia sea inferior al buy & hold en retorno absoluto.


7. Chequeos de integridad

  • Sin NaN en ninguna serie.
  • Posición ∈ {0, 1}.
  • Entradas y salidas alineadas tras señal del día previo (sin look-ahead).
  • Equity reconciliada por doble método.
  • Dividendos incluidos vía ^SP500TR.
  • Cash rentando T-bill 3m.
  • Costes 5 bps por cambio (101 cambios).
  • Sharpe con σ de retornos en exceso (denominador correcto).
  • Bootstrap por bloques (respeta autocorrelación).

8. Comparativa 15 años vs 37 años

Métrica 2011-2026 (15y) 1988-2026 (37y)
CAGR estrategia 7.23% 9.88%
CAGR BH 13.76% 11.25%
Diff CAGR -6.53% -1.37%
Sharpe Estrat 0.46 0.555
Sharpe BH 0.75 0.530
MaxDD Estrat -28.32% -34.81%
MaxDD BH -33.79% -55.25%
Calmar Estrat 0.26 0.284
Calmar BH 0.41 0.204
p-value diff CAGR 0.002 0.234
Combinaciones > Sharpe BH 3/64 52/64

La muestra corta era trampa. 2011-2026 excluye los dos bear markets estructurales (2000-02 y 2008-09) donde la estrategia añade todo su valor. Al extender al histórico completo disponible del ^SP500TR, la estrategia se convierte en una alternativa defensiva razonable.


9. Limitaciones persistentes

  1. 37 años siguen siendo una muestra limitada: el periodo 1966-1982 (inflación, lateral) no está cubierto por ^SP500TR. Con datos de Shiller podría ampliarse.
  2. Solo 2 bear markets estructurales en la muestra: casi toda la ventaja viene de dot-com y GFC. Si el siglo XXI tiene más crashes tipo COVID (V-shaped rápidos), la estrategia rinde peor.
  3. Sin impuestos: 101 cambios de posición generan hecho imponible; en cuenta no exenta y tipo alto, el CAGR neto de impuestos caería varios puntos. Este efecto puede invertir el ranking vs buy & hold.
  4. Sin costes dinámicos: 5 bps es razonable pero asume ejecución en ETF líquido (SPY/IVV). Sobre futuros ES el coste sería menor; en fondos mutuos, mayor. En fechas de crash, el slippage real puede ser 20-50 bps.
  5. Data snooping: 64 combinaciones exploradas. El “top” (21&42 / 63&189) debería validarse out-of-sample antes de usarse en producción.
  6. Cash a T-bill 3m: asume reinversión diaria perfecta; en la práctica, un money-market tendría fricción menor pero spread mínimo.
  7. Bootstrap por bloques con un solo tamaño (21d): no probé sensibilidad a otros tamaños de bloque (5d, 63d). Resultados podrían variar ligeramente.
  8. Ventanas rolling solapadas: ya señalado arriba — los porcentajes deben leerse como exploratorios.
  9. Sortino peor que Sharpe sugiere asimetría oculta: la mejora de Sharpe se debe más a recorte de vol al alza que a vol a la baja. Un inversor preocupado solo por el downside encuentra el beneficio reducido.

10. Conclusión del analista

La estrategia sí tiene valor en una muestra larga, pero no por razones de retorno sino por protección en bear markets estructurales. Es un seguro con coste razonable, con matices:

  • En 2000-02 ahorró 22 pp de drawdown; en 2008-09 ahorró 39 pp — donde está todo su valor.
  • A cambio, en mercados alcistas largos (post-2009, post-2020) deja rentabilidad sobre la mesa.
  • Sharpe y Calmar superiores muestran que el trade-off es favorable para un inversor que pondere el riesgo total.
  • Pero el Sortino es ligeramente peor, lo que debería hacer reflexionar: la estrategia no reduce la vol a la baja tanto como la total. Los whipsaws contribuyen con pequeñas pérdidas que no reducen el peor DD pero sí la vol “buena”.
  • El veredicto estadístico es honesto: en la muestra disponible no podemos rechazar igualdad con el BH al 95% (p = 0.234).

¿Para quién es adecuada?

  • Inversores que no soportan psicológicamente DD >40%.
  • Fondos con límites contractuales de drawdown.
  • Carteras donde la reducción de volatilidad justifica costes fiscales.

¿Para quién no?

  • Inversores con horizonte muy largo e indiferencia al drawdown.
  • Cuentas imponibles sin reinversión eficiente.
  • Quien crea que el próximo régimen será como 2011-2026.
18 Me gusta

Estoy literalmente abrumado por la extensión y profundidad de su respuesta, y debo agradecerle el interés que se ha tomado en ello.

Esta es una estrategia que hace tiempo tengo programada en VChart y mis resultados no coinciden en absoluto. con los suyos. Por ir a lo más llamativo a mi me salen 17 operaciones, que serian 34 cambios de posición, contra los 101 cambios de posición que Ud indica. Algo pasa aquí y tendré que revisar la programación por si he olvidado algo.

De todas formas debo decir que esta, y otras estrategias que tengo programadas, son un pasatiempo por afición y que mi actividad inversora real va por otros derroteros. Si he expuesto la estrategia es porque creo que 1/ es bastante mejor que la del cruce dorado, mencionada anteriormente y 2/ es más simple de llevar a cabo, puesto que solo se necesita la web del banco.

Respecto a lo del 60-40, la verdad es que la renta fija me produce una cierta alergia.

Le agradezco de nuevo su interés y me emplazo a presentar mis resultados en breve. Lo cierto es que me había propuesto no volver a entrar en VChart, pero tendré que hacerlo!

8 Me gusta

Estimado Alan Turing

Creo que por error no le he dirigido directamente el post anterior a este. Le ruego me disculpe.

3 Me gusta

Estimado Alan Turing

Estos son los resultados de la estrategia presentada en el post anterior, con la programación revisada:

Aplicada desde el 1-1-1996 a 31-12-2025, sobre el índice SP500, y sobre barras mensuales.

Número de operaciones: 13 (no 17 como creía recordar)

CAGR 8,95% En operativa real sobre un ETF habría que considerar una rentabilidad adicional por el impacto de los dividendos no considerados en el índice.

Max DD 22,68% El sistema evita completamente las caídas de 2002 y 2003, no así la de 2001.

De cuando desarrollé el sistema recuerdo que había una gran diferencia de aplicarlo sobre barras mensuales (precios de cierre efectivos de final de mes) o sobre barras diarias y considerando meses de 21 o 22 días. Recuerdo haber pensado que operar en barras mensuales tenia algo “mágico”, posiblemente la explicación es que hay muchos intervinientes en el mercado que operan en base a estos precios de cierre de mes.

Para finalizar, no he pretendido ensalzar o magnificar las virtudes del sistema, solo exponer una alternativa fácil y simple al B&H y al Cruce Dorado.

8 Me gusta

¿Tiene el código para echarle un vistazo? Y así sacamos donde está la discrepancia. Solo si le interesa, puede mandármelo por privado o lo que prefiera.

5 Me gusta

Acabo de contestar por privado.

Saludos

3 Me gusta

Después de revisar lo que me ha enviado por privado, yo había realizado el backtest usando el valor diario y un lookback de x meses, no el valor al final del mes. También en los valores del privado usa solo el precio, no el total return. Aquí lo recalculo y la estrategia sale bastante mejor.






17 Me gusta