martes, 30 de noviembre de 2010

Antecedentes Históricos de la Probabilidad & Estadística

Probabilidad & Estadística

Gráficos Estadísticos

Gráficos Estadísticos

Uno de los objetivos de la estadística es comunicar los resultados de una investigación, de manera clara concisa y significativa, las representaciones graficas de estos resultados no obedecen a una intención meramente estética si no que son un valioso recurso para facilitar el objetivo.

El grafico es útil para dar una rápida idea de la situación general que se está analizando, permite determinar por un simple examen, el máximo y el mínimo de las variaciones de un fenómeno, poniendo de relieve lo que debe tomarse en cuenta especialmente.

Aunque existen muchos tipos de gráficos, estudiaremos únicamente los más usuales. Algunas graficas de barra y línea, y el grafico circular y el grafico pictograma.

Gráfico de Barra

Es uno de los mejores para realizar comparaciones de datos estadísticos porque además de representar los valores absolutos de los datos en sí,  da una imagen de cómo se reparten los demás de conjunto respecto al total. La construcción de este grafico se basa en la representación de un valor numérico por un rectángulo, cuya longitud es proporcional a ese valor.

Factores para construir un grafico de barras que se deben tomar en cuenta:
1.- La línea de la base.

2.- Todas las barras deben partir de una horizontal, llamada línea base, para poder hacer comparaciones entre las dimensiones de las mismas con una simple y rápida inspección.

3.- El ancho de las barras:
Es arbitrario pero tiene que ser igual para todas las barras de un mismo gráfico. Depende de número de datos que se vallan a representar y del espacio disponible para la construcción del grafico.

4.- la separación entre barras:
Las barras de un grafico pueden o no estar separados, dependiendo del tipo de variable que representa. Debe haber espacio entre una y otra cuando los datos pertenezcan a variables nominales o ordinales. Dicho espacio no debe ser menor que la mitad del ancho de una barra ni mayor del ancho de la misma y a de ser igual entre todas las barras. Cuando los datos son de variables cardinales de debe haber separación frente a las barras.

EJEMPLO: 

De la tabla siguiente construir un grafico de barra.

Accidentes de tránsito con resultados fatales en zona urbana por tipo de accidenté. México 1997


TIPOS DE ACCIDENTES
TOTAL
CHOQUE CONTRA OTRO VEICULO DE MOTOR
835
ATROPELLAMIENTO
1249
ACCIDENTE DE UN SOLO VEICULO
625
OTROS
201


Anuario estadístico de los estados unidos mexicanos 1999, pagina 551.

PROCEDIMIENTO

Los 4 tipos de coches representan una variable nominal: por lo tanto se usaran 6 rectángulos entre sí.
Se trazan los ejes de coordenada y se produce a marcar el inicio y el término de cada una de las barras.
Se determina los tres cuartos de la distancia anterior  y se establece una razón entre la medida resultante y la mayor intensidad numérica de la distribución.

 
18cm x ¾ =13.5 /1249 = 0.0108056 

CON ESTOS DATOS TENDREMOS LA ALTURA DE NUESTRAS BARRAS


1249 x 0.0108056 = 13.4 cm
835   x 0.0108056 = 9.0 cm
625   x 0.0108056 = 6.7 cm
201   x 0.0108056 = 2.1 cm






            Accidentes de tránsito con resultados fatales en zona urbana por tipo de accidente, México 1997.

 

 HAY QUE COLOCAR SIEMPRE LA FUENTE: Anuario estadístico de los estados unidos mexicanos 1999, pagina 551.

GRÁFICO DE PASTEL

Se le llama también grafico de pastel y es bastante útil para representar porciones o porcentajes. Es de hecho, una forma alternativa al grafico de barras para representar una distribución de variable nominal. En su construcción se utiliza una circunferencia, cuyo círculo se divide en sectores tales que sus medidas angulares, sean proporcionales a los valores que representan. Estas medidas se obtienen, mediante una regla de 3 simple.

Sin embargo en este caso particular resulta todavía más simple, de aquel factor constante que surge de la relación ese es el mismo en todos los casos, debido a que toda circunferencia se divide convencionalmente en 360 grados y la suma de todos los datos de una distribución determinada equivale al 100%. Así la relación que se establece es:              360grados/100%     =    3.6

PROCEDIMIENTO

Se suman las frecuencias de las categorías 





TIPOS DE ACCIDENTES
TOTAL
CHOQUE CONTRA OTRO VEICULO DE MOTOR
835
ATROPELLAMIENTO
1249
ACCIDENTE DE UN SOLO VEICULO
625
OTROS
201

SUMA DE LAS FRECUENCIAS DE CADA CATEGORÍA:       2910


Se expresan todas las secuencias en porcentaje se divide cada uno entre el total y el cociente se multiplica por 100%.

1. DESPUÉS EL RESULTADO  LO MULTIPLICAS POR 100 QUE ES EL PORCENTAJE
2. EL RESULTADO SE MULTIPLICA POR 3.6 DESPUES DE ESTO TE DARA LOS GRADOS QUE USARAS PARA LA GRAFICA DE PASTEL
3. PRIMERO DIVIDES CADA UNA DE LAS FRECUENCIAS ENTRE LA SUMA DE FRECUENCIAS


1249 /  2910 = 0.42 x 100 = 42 x 3.6 =  160 grados
835   /  2910 = 0.28 x 100 = 28 x 3.6 =  100 grados
625   /  2910 = 0.21 x 100 = 21 x 3.6 =  76   grados
201   /  2910 = 0.06 x 100 = 6   x 3.6 =  24   grados





Accidentes de tránsito con resultados fatales en zona urbana por tipo de accidente, México 1997.

Anuario estadístico de los estados unidos mexicanos 1999, pagina 551.

Tablas estadísticas

Tablas estadísticas

Efectuando la clasificación de los datos, es necesario representarlos de manera clara, sintética y significativa para su mejor y fácil entendimiento. La tabla juega el papel fundamental pues es la base de la construcción del grafico y del análisis estadístico.

La tabla o cuadro estadístico consta de tres partes que reciben nombres que anuncian la peculiaridad fundamental de su estructura que son: cabeza, cuerpo y pie.

Cabeza o Encabezamiento

Es la parte superior de la tabla que contiene el titulo que expresa clara y concisamente el contenido o significado de la información l periodo es el espacio de tiempo para el cual validada la información: la unidad de medida siempre y cuando sea común a toda la información.

Cuerpo

Este localizado en la parte central de la tabla y en él se encuentra la esencia misma de la información, es decir, las categorías de las variables y sus correspondientes frecuencias.

Pie

Lo forma la parte inferior de la tabla, que está destinado a las notas o aclaraciones indicadas en el encabezamiento o en el cuerpo (cuando son necesarios): además menciona la fuente u origen de la información.

Variables

Estadísticas

Se define como un conjunto de procedimientos que sirven para organizar y resumir datos y hacer inferencias a partir de ella y transmitir los resultados de manera clara y concisa. La estadística se divide en dos grandes ramas:

Estadística descriptiva: se  define como un conjunto de procedimientos que sirve para organizar y describir sin que las conclusiones que se extraigan de estos datos rebasen su ámbito especifico.

Estadística inferencial: se define como un conjunto de procedimientos que se emplean para hacer inferencia e ingneralizaciones respecto a una totalidad partiendo el estudio de un número limitado de casos tomados.

Variable cualitativa nominal

Se presentan modalidades no numéricas que no admiten un criterio de orden. Ejemplo., es estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y vivo.

Variable cualitativa ordinal o variable cuasicuantitativa

Lo único que puede hacerse es establecer frecuencias en cada atributo y la igualdad o desigualdad entre los diferentes casos, ver cuál es el grupo que no tiene mayor frecuencia alcanzado el concepto de moda y también obtener algunas medidas de asociación cuando se relacionan variables entre si.

Ejemplos de variables nominales.

Genero. Al género se refiere a (hombre) heterosexual, homosexual y bisexual.
La raza cierto a la raza se refiere a que podría ser española, francesa, dependiendo el tipo que una haga referencia.

Notación Sigma

MEDIDAS DE TENDENCIA CENTRAL

Mediana, media y moda (serias de datos simples sin frecuencias asociadas).
Las medidas de tendencia central son categorías o puntos dentro del recorrido  de una variable, se les llama de tendencia central porque entorno a ellas parecen agruparse los datos. Sirve para resumir todo un conjunto de valores. En general cualquier medida de tendencia central es un valor media, ya que este, por definición, es todo valor que se haya entre dos extremos. Por esta razón a cada indicador de tendencia central se le nombra y define de manera diferente.

MEDIA ARTIMETICA

Es la más reconocida de las medidas de tendencia central aunque no con ese nombre. Cuando nos preguntamos, al término de un ciclo escolar, cuál era el promedia que habíamos obtenido, dándonos la respuesta con solo sumar las calificaciones alcanzadas en las diferentes asignaturas y dividir el resultado entre en número de ellas. Se le conoce también con los nombre de valor medio, promedia aritmético o simplemente media. Se le simboliza con cualquiera de las letras para representar variables, coronada con una barrita. Se le define como la suma de un conjunto de cantidades divididas entre el número de ellas, en símbolos.

= ∑X/N
Donde x simboliza los datos de una variable y N el número de ellos, por ejemplo:
=6+7+8+9+10           Obtener su promedio aritmético.
=∑x/N=6+7+8+9+10/5
=∑x/N=40/5
=8

Mediana

Llamada también valor mediano, es el punto dentro del recorrido de una variable que supera a no más de la mitad de los datos y es superado por no más de la otra mitad. Dicho de otra manera: es un punto dentro de una distribución de datos que tienen la característica de dividirla en dos partes iguales. La identificaremos con el símbolo “M”, tratándose de series de datos sin frecuencias asociadas no se necesita ninguna fórmula para ayarla, pero es preciso ordenarlos de menor a mayor o viceversa.

Si el número de datos de la variable es par y la mediana es la semi-suma de los dos valores intermedios que satisfacen su definición, ejemplo:

X=6, 7, 8, 9, 10
M=Nº+1/2 = 5+1/2 = 6/2 = 3
M= 8
X=5, 6, 7, 8, 9, 10
M= 7+8/2 = 15/2 = 7.5

Moda

También llamada moda o valor modal, este dato de variable que aparece más veces en una distribución en otra palabras es el dato de variable que tiene mayor frecuencia, se trata de hecho del caso más notorio o típico de una distribución de datos y se simboliza con :
M

Ejemplo:
2, 3, 2, 4, 4, 2, 5
M= 2