La Historia Detrás de Nuestro Modelo de Predicción de Precios del Aceite
Cómo aprendimos que en el mercado del aceite, menos datos pueden significar mejores predicciones. Una reflexión sobre el desarrollo de nuestro sistema OBI y los errores que nos enseñaron el camino.
Cuando empezamos a trabajar en el modelo OBI (Olearia Benchmark Index), teníamos una idea muy clara de lo que queríamos hacer: predecir el precio del aceite de oliva con suficiente antelación para que las cooperativas pudieran tomar mejores decisiones de comercialización.
Lo que no teníamos tan claro era cómo hacerlo. Y esa incertidumbre, aunque incómoda al principio, resultó ser el motor de todo lo que aprendimos después.
El mercado que dejó de comportarse como esperábamos
Cualquiera que haya seguido el mercado del aceite de oliva en los últimos años sabe que algo cambió. Los precios, que durante décadas habían seguido patrones más o menos predecibles ligados a la producción y la climatología, empezaron a moverse de formas que nadie anticipaba.
La sequía de 2023 fue un punto de inflexión. No solo por su severidad, sino por cómo el mercado reaccionó a ella. Las correlaciones históricas entre lluvia y precio, que habían funcionado razonablemente bien durante años, simplemente dejaron de aplicar.
Nos dimos cuenta de algo importante: el mercado del aceite de oliva había dejado de ser un sistema lineal. Ya no bastaba con decir “si llueve menos, el precio sube”. La realidad era mucho más compleja, con múltiples variables interactuando de formas que los modelos tradicionales no capturaban.
El error que nos enseñó más
Nuestra primera aproximación fue la que probablemente haría cualquier equipo de datos: recopilar toda la información posible. Precios históricos, datos meteorológicos, índices de consumo, exportaciones de otros países productores, tipos de interés, confianza del consumidor… Llegamos a alimentar nuestros modelos con más de 200 variables diferentes.
El resultado fue decepcionante.
El modelo parecía funcionar muy bien cuando lo probábamos con datos del pasado. Pero cuando intentábamos predecir el futuro, fallaba estrepitosamente. Había memorizado patrones históricos, pero no había aprendido nada útil sobre cómo funciona realmente el mercado.
Este fenómeno, que en machine learning se llama “sobreajuste”, fue una lección valiosa. Más datos no significa mejores predicciones. A veces significa exactamente lo contrario.
La paradoja de la simplicidad
La versión actual de nuestro modelo, OBI v15, utiliza solo 12 variables. Sí, 12. Después de probar cientos, nos quedamos con las pocas que realmente importan.
¿Cuáles son? No vamos a revelar la receta exacta, pero sí podemos contar la lógica detrás de la selección. Cada variable que incluimos debe superar un test de causalidad: no basta con que esté correlacionada con el precio, tiene que haber una relación de causa-efecto demostrable.
Por ejemplo, el nivel de existencias en los almacenes tiene una relación causal clara con el precio. Si hay poco stock, los precios suben. Si hay mucho, bajan. Esto no cambia con el tiempo ni depende de modas o sentimientos.
En cambio, el índice de confianza del consumidor, aunque a veces correlaciona con los precios, no tiene una relación causal directa. La gente no deja de comprar aceite de oliva porque esté pesimista sobre la economía. Es un producto básico con una demanda muy inelástica.
Esta distinción entre correlación y causalidad fue clave para nosotros.
Entendiendo que el mercado tiene “modos”
Otro aprendizaje fundamental fue que el mercado no se comporta igual en todas las circunstancias. Hay momentos de calma donde todo funciona de forma predecible, y hay momentos de tensión donde las reglas habituales dejan de aplicar.
Pensemos en la crisis de 2023-2024. Cuando las existencias bajaron a niveles críticos, el mercado entró en un modo completamente diferente. Cualquier noticia, por pequeña que fuera, provocaba movimientos de precio desproporcionados. Los compradores acumulaban stock por miedo a quedarse sin producto, lo que a su vez presionaba más los precios al alza.
Nuestro modelo intenta identificar en qué “modo” está el mercado antes de hacer predicciones. No es lo mismo predecir precios cuando hay abundancia que cuando hay escasez. Las dinámicas son completamente diferentes.
Esta idea de “regímenes de mercado” no es nueva en finanzas, pero aplicarla al aceite de oliva requirió adaptarla a las particularidades del sector.
El papel de las imágenes satelitales
Una de las fuentes de datos que más valor aporta a nuestro modelo son las imágenes satelitales. Pero aquí también tuvimos que aprender por las malas.
Al principio utilizábamos el índice NDVI, el estándar de la industria para medir el vigor de la vegetación. El problema es que el NDVI funciona muy bien para cultivos densos como el trigo o el maíz, pero no tanto para el olivar.
En un olivar tradicional, con árboles separados varios metros entre sí, la mayor parte de lo que ve el satélite es suelo, no árboles. El índice estaba midiendo más tierra que olivos, lo que introducía mucho ruido en nuestras estimaciones.
La solución fue cambiar a un índice diferente, el SAVI, que está diseñado específicamente para corregir la influencia del suelo. Con este ajuste, nuestra capacidad de estimar la producción esperada mejoró sustancialmente.
También aprendimos que hay momentos críticos en el ciclo del olivo donde las imágenes satelitales son especialmente reveladoras. La floración, por ejemplo, es un período clave. Si los árboles muestran señales de estrés hídrico en esas semanas, es muy probable que la cosecha se resienta, y eso acabará reflejándose en los precios meses después.
Lo que el modelo no puede hacer
Nos parece importante ser honestos sobre las limitaciones. Ningún modelo predice el futuro con certeza, y el nuestro no es una excepción.
Hay eventos que simplemente no podemos anticipar. Una helada tardía inesperada, un conflicto geopolítico que afecte al comercio internacional, cambios regulatorios súbitos… Estos “cisnes negros” están fuera de las capacidades de cualquier sistema predictivo.
También hay un horizonte temporal más allá del cual las predicciones pierden fiabilidad. Nuestro modelo funciona razonablemente bien para los próximos meses, pero intentar predecir qué pasará dentro de un año o dos sería poco más que especulación.
Y hay sesgos regionales. Hemos desarrollado el modelo pensando en el mercado español y mediterráneo. Puede que funcione diferente en otros contextos.
Una reflexión sobre el futuro del sector
Más allá de nuestro trabajo específico, creemos que el sector oleícola está en un momento de transformación. La volatilidad de los últimos años ha demostrado que las formas tradicionales de comercialización, basadas en la experiencia y la intuición, tienen límites.
No decimos que la experiencia no tenga valor. Al contrario, muchas de las variables que mejor funcionan en nuestro modelo son las que los operadores experimentados siempre han tenido en cuenta. La diferencia es que ahora podemos cuantificarlas y procesarlas de forma sistemática.
Creemos que el futuro no está en elegir entre intuición humana y algoritmos, sino en combinar ambos. Las herramientas analíticas pueden procesar información a escala y detectar patrones sutiles, pero la interpretación final y las decisiones estratégicas seguirán requiriendo juicio humano.
Lo que viene
Seguimos trabajando en mejorar el modelo. Cada campaña nos enseña algo nuevo, y cada crisis nos obliga a replantearnos supuestos que dábamos por sentados.
También estamos explorando cómo hacer estas herramientas más accesibles. Hasta ahora, la analítica avanzada ha sido territorio de grandes empresas con recursos para invertir en equipos de datos. Pero creemos que las cooperativas y los productores más pequeños también deberían poder beneficiarse de estas capacidades.
Es un camino largo, pero nos parece que merece la pena recorrerlo.
¿Te interesa saber más sobre cómo aplicamos estas ideas en nuestro trabajo? En AIXA AI desarrollamos herramientas de inteligencia de mercado para el sector agroalimentario. Escríbenos y hablamos.
Artículos Relacionados
Continúa explorando más contenido sobre Tecnología
Cómo Estamos Construyendo Olearia Intelligence: Lecciones del Camino
Reflexiones sobre el desarrollo de un producto de datos complejo. Los errores que cometimos, las decisiones que acertamos y lo que estamos aprendiendo en el proceso.
Estimaciones de Precios en el Mercado Europeo del Aceite: Lo Que Aprendimos Construyendo las Nuestras
El mercado oleícola europeo tiene un problema conocido: los datos oficiales llegan tarde. Esto es lo que descubrimos cuando decidimos abordarlo de forma sistemática.
Tu Móvil Ya Es Más Inteligente Que el Superordenador de 2020 (Y Eso Es Solo El Principio)
Los NPUs en smartphones alcanzan hasta 47 TOPS y ejecutan modelos que hace apenas tres años requerían datacenters completos. Análisis de la revolución Edge AI que está transformando cómo interactuamos con la inteligencia artificial en 2025.
¿Te ha gustado este artículo?
Recibe más contenido como este directamente en tu correo. Guías prácticas y las últimas innovaciones en IA empresarial.
Sin spam
Datos protegidos