Acceder

Varianza

 
La varianza es una medida de dispersión o variabilidad de un conjunto de datos. Se utiliza para evaluar cuán alejados están los valores de un conjunto de observaciones respecto al promedio o media. 

Para ser más precisos, la varianza de una serie de datos es la suma de los residuos al cuadrado dividida entre el número de observaciones. Los residuos se calculan como la diferencia entre cada uno de los datos y la media (aritmética).

La varianza es una forma de medir qué tan dispersos se encuentran los datos de una población o muestra respecto a su promedio.

En finanzas, la varianza se usa a menudo para medir el riesgo de una inversión o del mercado. Cuanto mayor sea la varianza, mayor será la volatilidad a la que el inversor se está exponiendo, y lo mismo sucede en sentido contrario.

Fórmula de la varianza


Para hallar la varianza de un conjunto de datos, se necesita primero calcular el valor promedio o media de los datos. Luego, se resta cada valor menos la media, y se eleva al cuadrado el resultado de cada una de estas restas.

Finalmente, se suman todas las restas al cuadrado y se divide el resultado entre el número de valores analizados. Así, llegamos a la varianza.

La fórmula de la varianza es la siguiente:


donde:

x = Cada valor del conjunto de datos
μ = Media de todos los valores del conjunto de datos
N = Número de valores del conjunto de datos


donde:

fi = Frecuencia absoluta de clase, es decir, el número de elementos correspondientes a cada clase.
xi= Marca de clase, que es el punto medio entre el límite inferior y superior de cada clase.

¿Por qué elevar al cuadrado las observaciones? Pues, si simplemente sumamos las desviaciones, el resultado sería cero. Por ello, para aproximarnos a una medida de la dispersión, elevamos al cuadrado, y esto tiene además como consecuencia que la varianza siempre será positiva. 

Recordemos que al elevar el cuadrado un número negativo, el resultado es positivo. Por lo tanto, la sumatoria de los residuos siempre es positiva, y por ende, la varianza también será positiva.

Asimismo, debemos aclarar que utilizamos N cuando estamos analizando una población estadística. Sin embargo, lo cambiaremos por n-1 si estamos frente a una muestra.

La varianza se expresa en unidades cuadradas y suele usarse junto con la desviación típica o estándar, que es la raíz cuadrada de la varianza.

La desviación estándar mide la dispersión de los datos de la misma manera que la varianza, pero en lugar de estar expresada en unidades cuadradas, está expresada en las mismas unidades que los datos originales.

Es decir, si estamos, por ejemplo, ante un conjunto de datos medidos en metros, la varianza estará en metros cuadrados, mientras que la desviación típica sí debe leerse en metros.

La varianza para medir el riesgo de una inversión


Cuando se evalúa el riesgo de una inversión, es importante tener en cuenta que no solo se trata de la posibilidad de pérdida, sino también de la volatilidad o fluctuación de los rendimientos

Una inversión con una alta varianza implica un mayor riesgo, ya que los rendimientos pueden fluctuar significativamente. Por otro lado, una inversión con una baja varianza implica un menor riesgo, pues los rendimientos son menos volátiles. 
 
Para utilizar la varianza para medir el riesgo de una inversión, sigue estos pasos:

  1. Reúne los datos de rendimiento de la inversión. Estos datos pueden incluir el rendimiento diario, semanal, mensual o anual de la inversión durante un periodo de tiempo determinado.
  2. Calcula el valor promedio o media de los rendimientos de la inversión. Para hacerlo, suma todos los rendimientos y divide el resultado por el número de datos.
  3. Resta cada rendimiento periódico menos el valor promedio y eleva al cuadrado el resultado de cada una de estas restas.
  4. Suma todas las restas al cuadrado y divide el resultado entre el número de valores del conjunto de datos. De ese modo, encontramos la varianza de la inversión.
  5. Utiliza la varianza para evaluar el riesgo de la inversión. Una inversión con una alta varianza implica un mayor riesgo debido a la mayor variabilidad de los rendimientos. Por el contrario, una baja varianza, significa un menor riesgo por la menor dispersión de los resultados. Recordemos, además, que a mayor riesgo, mayor rentabilidad, por lo que dependerá del inversor qué nivel de varianza está dispuesto a tolerar.

Ventajas y desventajas de la varianza


Entre las ventajas de la varianza podemos destacar:

  • Es relativamente fácil de calcular, sobre todo, si contamos con la ayuda de un sistema informático. Incluso, la fórmula está disponible para usar de forma automática en el caso Excel, donde solo seleccionando los datos analizados se puede hallar la varianza.
  • Todas las desviaciones son tratadas de igual forma, sin importar su dirección (por arriba o por debajo de la media).
  • Puede aplicarse al analizar modelos de regresión. Cuando nos referimos a heterocedasticidad, por ejemplo, significa que la varianza de los errores no es constante para todas las observaciones. Lo contrario a la heterocedasticidad es la homocedasticidad, cuando la varianza de los errores sí es constante.
  • La varianza es uno de los parámetros de la distribución normal. La campana de Gauss es más alta y estrecha cuando la varianza es menor, y viceversa.

Sin embargo, debemos tomar en cuenta algunas desventajas de la varianza:

  • No siempre es fácil de interpretar, a diferencia de la desviación estándar, que siempre estará medida igual que los datos. Por ejemplo, si analizamos las remuneraciones de un grupo de individuos, la varianza estaría denominada en euros o dólares al cuadrado.
  • Los datos atípicos, es decir, los que se alejan mucho de la media, pueden afectar el resultado.
  • Nos muestra la desviación respecto a la media, pero no sabemos si la dispersión ha sido más hacia arriba o hacia abajo del promedio.

Ejemplo de varianza


Veamos un ejemplo de cómo calcular la varianza:



x
x-μ
(x-μ)^2
1
21,96
-5,06
25,59
2
22,60
-4,42
19,51
3
27,90
0,88
0,78
4
39,68
12,66
160,36
5
24,77
-2,25
5,04
6
24,34
-2,67
7,14
7
34,64
7,62
58,13
8
34,97
7,95
63,21
9
20,51
-6,50
42,29
10
31,36
4,34
18,86
11
27,06
0,04
0,00
12
21,79
-5,22
27,29
13
24,53
-2,48
6,17
14
20,02
-7,00
49,01
15
25,92
-1,10
1,20
16
20,10
-6,91
47,82
17
33,29
6,27
39,37
18
34,55
7,53
56,70
19
29,49
2,47
6,10
20
20,86
-6,16
37,96
sumatoria
540,34
0,00
672,54








media (μ)
27,02
varianza
35,3968

Como quizás habrás notado, hemos dividido la sumatoria de los residuos entre 19, que es n-1, porque asumimos que estamos frente a una muestra.

 Ahora, veamos un ejemplo con datos agrupados:



xi
fi
xi*fi








[0-10)
5
11
55
[10-20)
15
14
210
[20-30)
25
16
400
[30-40)
35
13
455
[40-50]
45
10
450
sumatoria


64
1.570












media (μ )
24,5313
 

Para hallar la media, sumamos los resultados de la fila de la derecha (xi*fi), y lo dividimos entre el número de datos (64).



(xi-μ)
(xi-μ)^2
((xi-μ)^2)*fi
[0-10)
-19,53
381,47
4.196,17
[10-20)
-9,53
90,84
1.271,83
[20-30)
0,47
0,22
3,52
[30-40)
10,47
109,59
1.424,73
[40-50]
20,47
418,97
4.189,70
sumatoria
2,34
1.001,10
11.085,94












varianza
175,9673
 

Para calcular la varianza, finalmente, dividimos entre n-1, es decir, 63 en este ejemplo.

¿Cómo medir la dispersión o no de la varianza?

Existen dos formas de medir la dispersión de un modelo de distribución, si esta tiende a ser constante (idealmente es lo que se busca, ya que significa que el modelo es constante), o si varía. Veámoslo
 
  • Homocedasticidad: Se refiere a una propiedad de un conjunto de datos en el que las varianzas de las diferentes subpoblaciones o grupos son iguales o muy similares. Esto significa que la dispersión o variabilidad de los datos en relación con la media es constante a lo largo de todos los grupos. En el contexto de la regresión, por ejemplo, la homocedasticidad implica que los residuos (diferencias entre los valores observados y los valores predichos por el modelo) tienen la misma varianza, independientemente del valor de las variables independientes.

  • Heterocedasticidad:  Por otro lado, lo opuesto ocurre cuando las varianzas dentro de un conjunto de datos no son iguales. En esta situación, la dispersión de los datos varía a lo largo de las observaciones o grupos. En el análisis de regresión, la heterocedasticidad se manifiesta cuando los residuos tienen varianzas que difieren en función del valor de las variables independientes. La presencia de heterocedasticidad puede ser problemática ya que viola las suposiciones de varios métodos estadísticos, lo que puede conducir a estimaciones sesgadas y conclusiones erróneas. 

En definitiva, la varianza es una medida estadística que describe la dispersión o el grado de variación de un conjunto de datos. Indica cuánto se alejan los valores individuales en un conjunto de datos de la media (promedio) de ese conjunto. 

 Artículo escrito en colaboración con @miguel-arias.

¿Buscas un broker para hacer trading? Mira nuestras recomendaciones:

OANDA

Más 25 años de trayectoria

Ver más
XTB

Comisiones 0% en acciones y ETFs

Ver más
ETORO

Depósito mínimo 200€

Ver más
INTERACTIVE BROKERS

Plataforma propia y cuenta demo

Ver más

¿Quieres referenciar esta definición?
Varianza, GuillermoWestreicher, 18 de diciembre del '23, Rankia.com
Definiciones de por letra