ESTADÍSTICA DESCRIPTIVA (parte2)

#SLICEofDATA Tu porción diaria de Data Analytics en solo 15 minutos

SLICEofDATA

May 10, 2022

Venimos de: ESTADÍSTICA DESCRIPTIVA (parte1)

En esta entrada vamos a analizar las distribuciones principales:

Distribución de Bernoulli

La distribución de Bernoulli es una distribución discreta con dos posibles valores:
• Éxito = 1
• Fallo = 0

Distribución Binomial

La distribución Binomial es una distribución discreta que cuenta el número de éxitos en una secuencia de n ensayos de Bernoulli independientes entre si y con una probabilidad de éxito fija [Media = np, Varianza = np(1-p)]

La distribución geométrica se utiliza para representar tiempos de espera y
se define como el número de experimentos Bernoulli necesarios hasta el
primer 1.
La distribución binomial negativa también se utiliza para representar
tiempos de espera y se define como el número de experimentos Bernoulli
necesarios hasta un cierto número de 1’s.

Distribución de Poisson

La distribución de Poisson es una distribución discreta que, a partir de una frecuencia de ocurrencia media, calcula la probabilidad de que ocurra un determinado número de eventos durante cierto período de tiempo (probabilidad de ocurrencia de sucesos con probabilidades muy pequeñas, o sucesos "raros“) [media = varianza = lambda]
Ejemplo: número de entradas a una web

Distribución Exponencial

Dada una distribución de Poisson con un ratio de oportunidad lambda, la distribución exponencial calcula la probabilidad del tiempo de espera entre dos sucesos de éxito con [media = varianza = lambda]
Ejemplo: tiempo transcurrido entre diferentes entradas a una web

Distribución Gamma

Es una generalización de la exponencial donde en lugar de medir el tiempo transcurrido hasta el primer evento esperamos hasta el evento n.
Ejemplo:tiempo transcurrido hasta la entrada n-esima a una web

Distribución Normal

La distribución normal es la que mas aparece en sucesos reales, es una distribución de probabilidad continua.

Distribución X2k

La distribución ji-cuadrado es una distribución continua con una variable k que representa los grados de libertad de la variable aleatoria.
[media = k, varianza = 2k], se acerca a una normal si k>5

Distribución t Student

La distribución t-student surge de la necesidad de estimar la media y la varianza de una población normal cuando la muestra es pequeña
[media = 0; si v>1, varianza = v/(v-2) ; si v>2]

Distribución F-Snedecor

La distribución F-Snedecor surge de dos variables independientes con distribución X2 y con grados de libertad n y m respectivamente.

Teorema Central del Límite

El Teorema Central del Límite (TCL) nos permite, bajo ciertas condiciones, usar la distribución normal para estudiar otras distribuciones más generales. Lo que nos indica es que ante experimentos muy grandes con diferentes causas que suman sus efectos, si lo que queremos estudiar es la suma de los efectos y no el detalle de cada uno de ellos, bajo ciertas condiciones el experimento se comportaría como una normal.

Transformación de var. Aleatorias

La tipificación de una
variable consiste en restar
la media y dividir por la
desviación típica.
Box-Cox, para obtener una variable
lo mas simétrica posible.