jueves, 2 de diciembre de 2010

Campana de Gauss

Campana de Gauss

La distribución normal es la distribución de probabilidad que con mas frecuencia aparece en estadística y teoría de probabilidades.
Lo Importancia de lo distribución normal se debe principalmente o que hoy muchos variables asociados o fenómenos naturales que siguen el modelo de lo normal:

Caracteres morfológicos de individuos (personas, animales, plantas,...) de uno especie, ejemplo. tallos, pesos, envergaduras, diámetros, perímetros.

Caracteres fisiológicos, por ejemplo: efecto de uno mismo dosis de un medicamento, o de uno mismo cantidad de abono.

Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo de individuos, puntuaciones de examen.

Caracteres psicológicos, por ejemplo: cociente intelectual, grado de adaptación a un medio.

Valores estadísticos muéstrales, por ejemplo: lo media.


Ejemplo: supongamos que se sabe que el peso de los sujetos de una determinada población sigue una distribución aproximadamente normal, con una media de 80 kg y una desviación estándar de 10 kg. ¿Podremos saber cual es la probabilidad de que una persona, elegida al azar, tenga un peso superior a 100 kg?



'Estadística'

'Estadística'

Como el área total bajo la curva es igual a 1, se puede deducir que:

'Estadística'
'Estadística'


Por lo tanto, la probabilidad buscada de que una persona elegida aleatoriamente de eso población tenga un peso mayor de 100 Kg , es de 1-0.9772=0.0228, es decir, aproximadamente de un 2.3%

miércoles, 1 de diciembre de 2010

Estadística

Estadística
La estadística es comúnmente considerada como una colección de hechos numéricos expresados en términos de una relación sumisa, y que han sido recopilados a partir de otros datos numéricos.
Medida de Tendencia Central: Un único valor que resume un conjunto de datos. Señala el centro de valores.
No hay una sola medida de tendencia central, se consideran 5: la media aritmética, media ponderada, la mediana, la moda y la media geométrica.

La media de una población es un parámetro (una característica medible de una población) , así como la amplitud de variación (la diferencia entre el valor más grande y el más pequeño en un conjunto de datos).
Para datos en vivo, no agrupados la media es:
Suma de todos los valores de una muestra
Media de una muestra = X =
Número de valores en la muestra n
Donde:
n número total de valores de la muestra
La media de una muestra, o cualquier otra medida basada en datos muestrales, se denomina dato estadístico (una característica de una muestra).
La media podría no ser un promedio adecuado para representar datos. La media se ve afectada de modo notable por valores extraordinariamente grandes o pequeños.
Mediana:
Para datos que contienen 1 o 2 valores sumamente grandes o muy pequeños, la media aritmética puede no ser representativa. El punto central puede describirse mejor utilizando una medida de tendencia central denominada mediana.
Moda:
El valor de la observación que aparece con más frecuencia.
Puede determinarse para todos los niveles de datos: nominal, ordinal, de intervalo y de razón. No se ve afectada por valores muy altos o muy bajos. Al igual que la mediana, puede utilizarse como medida de tendencia central para distribuciones con clases de extremo abierto.

Medidas de Tendencia Central
 Las medidas de tendencia central son la  media, la mediana y la moda.
 


La media es la suma de los valores de los elementos  dividida por la cantidad de éstos. Es conocida también como promedio, o media aritmética.
 

Fórmula de la media:
 

Media Poblacional 
= µ = X
                                          N
= sumatoria
µ = media
N = número de elementos
X = valores o datos
Esta fórmula se lee:
“mu es igual a la sumatoria de x dividido entre N”
 
                                      
Media Muestral:     
x  =  x
                                          n

 
 
Ejemplo:  Calcule la media de los siguientes  números:
 10 , 11 , 12 , 12 , 13
 

1. Sumar las cantidades       < 10 + 11 + 12 + 12 + 13 = 58>
2. Dividir la suma por la cantidad de elementos    < 58/5>
3. El resultado es la media    <11.6>
 

Por lo tanto, la media de los 5 números  es 11.6. Note que la media resulta un número que está entre el rango de elementos; en este caso, 11.6 está entre 10,11,12 y 13.
 
 


La mediana es el valor del elemento intermedio cuando todos los elementos se ordenan.

Fórmula de la mediana:
Mediana =  X[n/2 +1/2]            La parte de [n/2 + 1/2] representa la posición.
 

Donde X es la posición de los números y n  es el número de elementos.
Ejemplo:  Buscar la mediana de los siguientes números:
 2   4   1   3  5   6   3
Primero, hay que ordenarlos:
 1       2       3       3       4       5       6
  X  X2     X3      X4     X5    X6     X7        ( Las posiciones de los números)
 
Mediana =  X[7/2 + ½]
  X[3.5 + .5]          < Se cambió el ½ a .5>
  X4                 < La mediana está en la posición 4>
Por lo tanto, la mediana es  3.
 

La moda es el valor que se presenta el mayor número de veces.
Ejemplo 1: Buscar la moda de:
  5     12    9    5    8    7    1
Como la moda es el número que más se repite, la moda es 5.
 
 
Así como las medidas de tendencia central nos permiten identificar el punto central de los datos, las Medidas de dispersión nos permiten reconocer que tanto se dispersan los datos alrededor del punto central; es decir, nos indican cuanto se desvían las observaciones alrededor de su promedio aritmético (Media). Este tipo de medidas son parámetros informativos que nos permiten conocer como los valores de los datos se reparten a través de eje X, mediante un valor numérico que representa el promedio de dispersión de los datos. Las medidas de dispersión más importantes y las más utilizadas son la Varianza y la Desviación estándar (o Típica).


VARIANZA 

Esta medida nos permite identificar la diferencia promedio que hay entre cada uno de los valores respecto a su punto central (Media ). Este promedio es calculado, elevando cada una de las diferencias al cuadrado (Con el fin de eliminar los signos negativos), y calculando su promedio o media; es decir, sumado todos los cuadrados de las diferencias de cada valor respecto a la media y dividiendo este resultado por el número de observaciones que se tengan. Si la varianza es calculada a una población (Total de componentes de un conjunto), la ecuación sería::
 
Ecuación de la varianza para Poblaciones - Medidas de Dispersion

 

Donde () representa la varianza, (Xi) representa cada uno de los valores, ()) representa la media poblacional y (N) es el número de observaciones ó tamaño de la población. En el caso que estemos trabajando con una muestra la ecuación que se debe emplear es:


 
Ecuacion de la Varianza para una muestra - Medidas de dispersion


Donde (S2) representa la varianza, (Xi) representa cada uno de los valores, (
) representa la media de la muestra y (n) es el número de observaciones ó tamaño de la muestra

Desviación estándar

Esta medida nos permite determinar el promedio aritmético de fluctuación de los datos respecto a su punto central o media. La desviación estándar nos da como resultado un valor numérico que representa el promedio de diferencia que hay entre los datos y la media. Para calcular la desviación estándar basta con hallar la raíz cuadrada de la varianza, por lo tanto su ecuación sería:
 :
 
Ecuacion de la Desviación Estándar o Típica - Medidas de Dispersion

Ecuación 5-8
 
Para comprender el concepto de las medidas de distribución vamos a suponer que el gerente de una empresa de alimentos desea saber que tanto varían los pesos de los empaques (en gramos), de uno de sus productos; por lo que opta por seleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente.

Por lo que su media es:
 


La varianza sería:
 


Por lo tanto la desviación estándar sería:
 


Con lo que concluiríamos que el peso promedio de los empaques es de 507 gramos, con una tendencia a variar por debajo o por encima de dicho peso en 12 gramos. Esta información le permite al gerente determinar cuanto es el promedio de perdidas causado por el exceso de peso en los empaques y le da las bases para tomar los correctivos necesarios en el proceso de empacado.