Un ejemplo de esto es cómo determinar cuántas veces necesitas lanzar una moneda con una proporción de éxito de 60/40 (60% de caras y 40% de cruces, por ejemplo) para tener un 95% de certeza de que la moneda no es justa (50/50).
Usaremos el método de Wilson para el intervalo de confianza. La fórmula para el límite inferior del intervalo de confianza de Wilson es la siguiente:
p_L = (p + z^2 / (2n) – z * sqrt((p(1-p) + z^2 / (4n)) / n)) / (1 + z^2 / n)
Donde:
-
p_L es el límite inferior del intervalo de confianza
-
p es la proporción de éxitos (en este caso, 0.6)
-
n es el número de intentos (lanzamientos de moneda)
-
z es el valor crítico de la distribución normal (1.96 para un 95% de nivel de confianza)
Dado que queremos determinar cuántas veces se debe lanzar la moneda para tener un 95% de certeza de que no es justa, necesitamos encontrar el valor de n para el cual p_L > 0.5. Esto se debe a que si el límite inferior del intervalo de confianza es mayor que 0.5, podemos estar seguros de que la moneda no es justa al 95% de nivel de confianza.
Resolviendo la ecuación para n, y probando diferentes valores, encontramos que se necesitan al menos 97 lanzamientos de moneda para tener un 95% de certeza de que la moneda no es justa con una proporción de éxito de 60/40.
El método de Wilson es una técnica para calcular intervalos de confianza para una proporción en estadísticas. Un intervalo de confianza es un rango de valores, derivado de los datos de una muestra, que es probable que contenga el valor real de una población desconocida con un cierto nivel de confianza. En el caso de una proporción, como la proporción de caras y cruces en el lanzamiento de una moneda, un intervalo de confianza nos proporciona un rango en el que es probable que se encuentre la verdadera proporción de la población.
El método de Wilson, también conocido como el intervalo de confianza de Wilson o el método de la puntuación de Wilson, fue desarrollado por Edwin Bidwell Wilson en 1927. Es una mejora del intervalo de confianza normal, que se basa en la aproximación de la distribución binomial a la distribución normal. El método de Wilson corrige algunas de las limitaciones del intervalo de confianza normal, especialmente cuando la proporción de éxitos (p) está cerca de 0 o 1, o cuando el tamaño de la muestra (n) es pequeño.
La fórmula para el intervalo de confianza de Wilson es la siguiente:
p_L = (p + z^2 / (2n) – z * sqrt((p(1-p) + z^2 / (4n)) / n)) / (1 + z^2 / n)
p_U = (p + z^2 / (2n) + z * sqrt((p(1-p) + z^2 / (4n)) / n)) / (1 + z^2 / n)
Donde:
-
p_L y p_U son los límites inferior y superior del intervalo de confianza, respectivamente.
-
p es la proporción de éxitos en la muestra.
-
n es el tamaño de la muestra.
-
z es el valor crítico de la distribución normal (1.96 para un 95% de nivel de confianza).
Método de Wilson
El método de Wilson es preferido en comparación con otros métodos, como el intervalo de confianza normal (Wald) y el intervalo de confianza de Clopper-Pearson (exacto), por varias razones:
-
Corrección de sesgo: El método de Wilson corrige el sesgo que puede ocurrir en el intervalo de confianza normal, especialmente cuando la proporción de éxitos está cerca de 0 o 1, o cuando el tamaño de la muestra es pequeño.
-
Cobertura más precisa: A diferencia del intervalo de confianza de Clopper-Pearson, que es conservador y puede proporcionar intervalos más amplios de lo necesario, el método de Wilson proporciona una cobertura más precisa del intervalo de confianza, lo que significa que es más probable que contenga el valor verdadero de la población.
-
Simetría: El método de Wilson proporciona intervalos de confianza simétricos alrededor del valor estimado de la proporción, mientras que otros métodos pueden generar intervalos asimétricos.
En resumen, el método de Wilson es una técnica robusta y ampliamente utilizada para calcular intervalos de confianza para proporciones, ya que aborda las limitaciones de otros métodos y proporciona una cobertura más precisa y simétrica del intervalo de confianza.
Variables de las que depende el cálculo
Determinar si una moneda es falsa (es decir, no justa) en el contexto de lanzamientos de monedas depende de varios factores. Algunos de estos factores son:
-
Tamaño de la muestra (n): Cuanto mayor sea el número de lanzamientos de monedas que se realicen, más precisos serán los resultados y más fácil será determinar si la moneda es falsa. Con un tamaño de muestra pequeño, puede haber mucha variabilidad en los resultados, lo que dificulta sacar conclusiones sólidas.
-
Proporción de éxitos (p): La proporción de éxitos observada en los lanzamientos de monedas (por ejemplo, caras frente a cruces) es un indicador de si la moneda puede ser falsa o no. Si la proporción se desvía significativamente de 0.5 (la proporción esperada para una moneda justa), es más probable que la moneda sea falsa.
-
Nivel de confianza: El nivel de confianza seleccionado afecta la probabilidad de concluir que la moneda es falsa. Un nivel de confianza más alto requiere una evidencia más sólida para hacer tal afirmación. En general, se utilizan niveles de confianza del 95% o 99% en la mayoría de las aplicaciones estadísticas.
-
Método estadístico: La elección del método estadístico puede influir en la conclusión sobre si la moneda es falsa o no. Algunos métodos, como el intervalo de confianza de Wilson, son más precisos y menos propensos a errores que otros métodos, como el intervalo de confianza de Wald o el de Clopper-Pearson.
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
from math import sqrt
def intervalo_confianza_wilson(p, n, z):
p_L = (p + z**2 / (2 * n) - z * sqrt((p * (1 - p) + z**2 / (4 * n)) / n)) / (1 + z**2 / n)
p_U = (p + z**2 / (2 * n) + z * sqrt((p * (1 - p) + z**2 / (4 * n)) / n)) / (1 + z**2 / n)
return p_L, p_U
def buscar_n_para_pl_mayor_05(p, z):
n = 1
p_L = 0
while p_L <= 0.5:
n += 1
p_L, _ = intervalo_confianza_wilson(p, n, z)
return n
valores_p = [0.6, 0.7, 0.8, 0.9, 1]
niveles_confianza = [0.6, 0.7, 0.8, 0.9, 0.95]
colores = ['blue', 'orange', 'green', 'red', 'purple']
for nivel_confianza, color in zip(niveles_confianza, colores):
z = norm.ppf(1 - (1 - nivel_confianza) / 2) # Valor crítico correspondiente al nivel de confianza
necesarios = []
for p in valores_p:
n = buscar_n_para_pl_mayor_05(p, z)
necesarios.append(n)
plt.plot(valores_p, necesarios, marker='o', label=f"{nivel_confianza * 100:.0f}% de confianza", color=color)
plt.xlabel("Proporción de éxitos (p)")
plt.ylabel("Número de lanzamientos necesarios")
plt.title("Lanzamientos necesarios para p_L > 0.5 en función de la proporción de éxitos y el nivel de confianza")
plt.xticks(np.arange(0.6, 1.1, step=0.1))
plt.legend()
plt.grid()
plt.show()
Finalmente, si tengo una moneda que mantiene una proporción del 70% de una sola cara, debo tirarla 18 veces y que se mantenga esa proporción, para tener un 90% de certeza de que no es justa. Pero con menos de 10 tiradas, puedo saberlo con el 60%.