sábado, 20 de septiembre de 2008

UNIDAD I

  • Notación sumatoria.
  • Propiedades.
  • Datos no agrupados.
  • Medida de frecuencia central.
  • Medidas de dispersión.


Ejemplo:


Cuando "a" constante:


Si abc son constantes

  • Media aritmetica


Si los numeros X1, X2, Xk ocurren con frecuencia f1, f2....fk.


  • Frecuencia:



Frecuencia total: Media aritmetica ponderada:

Se asocia X1, X2, X3, Xk con factores de peso w1, w2, wk

Ejercicios:

Cual es la media aritmetica de 8, 3, 5 , 12 y 10

7.6

Si el examen final de un curso cuenta 3 veces mas que una evaluacion parcial y un estudiante obtiene una calificacion de 85 en el examen final y 70, y 90 en los dos parciales la calificacion media es:

X= 83

PROPIEDADES DE LA MEDIA ARITMETICA.

La suma aritmetica de las desviaciones de un conjunto de numeros con respecto a su media aritmetica es 0.

Ejemplo:

1.- Las desviaciones de los numeros 8, 3, 5, 12 y 10 en relacion con su media aritmetica 7.6 son:

8 - 7.6= 0.4

3 - 7.6= -4.6

5 - 7.6= - 2.6

12 - 7.6= 4.40

10 - 7.6=2.4

2.- La suma de los cuadrados de las desviaciones de un conjunto de numeros Xj con respecto de un cierto numero A es minima si y solo si A = Xmedia.

3.- Si f1 numeros tiene media M1, f2 numero tiene media M2....fk numeros tiene media, entonces la media de todos los numeros es






Es decir, una media aritmetica ponderada de todas las medias.

4.- Si A es una media aritmetica supuesta o conjeturada (que puede ser cualquier numero) y si dj=Xj - A son desviaciones de Xj respecto de A (Xj---A) tenemos que:




Calculo de la media aritmetica para calculos agrupados:




El conjunto de numeros 3,4,4,5,6,8,8,10

La media= 6

Del siguiente conjunto 5,5,7,11,12,15 y 18

9 + 11= 20 /2 = 10

Para datos agrupados la media aritmetica obtenida por interpolacion:


donde:

L1= Frontera inferior de la clase de la mediana (es la clase que contiene a la mediana)

N= Numero de datos.

Sumatoria F1= Suma de las frecuencias de las clases inferiores a la clase de la mediana.

f media= Frecuencia de la clase de la mediana.

C= Intervalo del tamaño de la clase de la mediana.

miércoles, 10 de septiembre de 2008

REGRESIÓN LINEAL CON PROMEDIO

Mediante el siguiente ejemplo iniciaremos el estudio de lo que es la regresion lineal.


Se estudia el ingreso economico mensual de familias dependientes de obreros reidentes. Dicho ingreso puede compararse contra la edad del padre de familia. D es este modo se estudian dos variables que representan a su vez una variable derivada suceptible de escribirse como un par ordenado estadistica (X,Y).

En la tabla siguiente se muestran los datos correspondientes a una muestra aleatoriade 30 familias.





INGRESO vs EDAD




FORMULAS:

Y=a + b(x)

∑Y=n*a + b∑X

∑XY= a*∑X + b∑X2

n= numero de muestras



CALCULOS:


1. ∑Y=195= (30)*a+(1378)*b

2. ∑XY=9123.8=(1378)+(64726)b


Sistema de ecuaciones simultaneas.
Solución:
a= 2.0470


b=0.0974

Sustituyendo

Y= a+ b(x)


Y= 2.0470 +0.0974x

PROBLEMAS Y EJERCICIOS

1. Suponga que el siguiente conjunto de datos es una muestra aleatoria de 40 calificaciones de autoconcepto.



a) Determine x máx, x mín, y el rango.

Xmáx= 117 Xmín= 63 Rango= 54


b) Cuantos intervalos sugeriría para mostrar la distribución?

Cerca de 10 intervalos a menos que en n sea muy grande.


c) Determine el ancho del intervalo, w para permitir 10 intervalos.

w= rango /10= 54/10= 5.4, redondeado a 5.


d) Si w= 5. Cual es el primer intervalo (valores mas bajos)?

El menor multiplo de 5 que es menor que 63 es 60: 60 - 64



e) Si w= 5, liste los intervalos.

f) Construya una distribución de frecuencias agrupada por los 40 valores. (utilice el método de conteo con estacas).

g) Construya columnas de porcentajes y porcentaje acomulado para esos datos.



h) Sería un polígono de frecuencias apropiada para esos datos? ¿Por que?


Sí, los polígonos de freciencia son excelentes para variables continuas.



i) Construya un poligono como el de la figura 2.4 con esos datos.



FRECUENCIA CONTRA PUNTO MEDIO DE INTERVALO.




j) Construya una ojiva de esos datos.


% ACUMULADO vs LIMITE SUPERIOR

k) Estime P10, P50 y P90 utlizando la ojiva.

P10= 80 P50= 100 P90= 110


l) construya una grafica horizontal de caja y patillas para esos datos (Nota: La graficas de caja pueden tener una orientación vertical u horizontal. Para la orientacion Horizontal, las platillas se extienden a la izquierda y a la dereha de la caja)



m) Comente sobre la aparente simetría o asimetría de esos datos.

Parece que la distrubución es asimetrica y a la izquierda.

n) ¿ Como diferirá una ojiva de asimetría positiva de la asimetría negativa?

La ojiva de una distribucion asimetrica positiva se elevara muy rapido de la linea base en el lado izquierdo de la ojiva debido al conjunto de valores en las regiones mas bajas. po otro lado, la ojiva de una distribución asimetrica negativa no comenzará a elevarse rápidamente sino hasta que alcance los valores altos en el lado derecho de la figura.

o) ¿ Puede suponer como podría aparecer la ojiva de una distribución rectangular?

Una linea recta inclinada hacia arriba desde el extremo inferior izquierdo hasta el extremo superior derecho.


2. El siguiente conjunto de datos es de una muestra aleatoria de 50 casos de los datos del HSB. En este caso, los números representan la raza de los individuos, de donde 1= hispano, 2= asiático, 3= negro, 4= blanco.

a) ¿ Un polígono de frecuencia es apropiado para graficar esos datos ? ¿Por que?

No, ya que esos datos son categorias mas cuantitativamente continuos.



b) ¿ Es apropiada una gráfica de barras para graficar esos datos? ¿Por que?


Una ecelente elección, ya que los datos no tienen un continuo funfamental.


c) Construya una distrubución de frecuencias agrupadas para esos datos. utilice el método de conteo de Turkey.)


d) Construya una clumna de porcentajes para esos datos.


e) Construya un histograma de frecuencias para esos datos.




f) Etiquete el eje vertical de la figura en el inciso (e) para indicar freciencias y porcentajes.


g) ¿Habría probablemente brechas entre las columnas del histograma? ¿Por qué?


Si, ya que es congruente con los datos categóricos no clasificados.

PROBLEMAS Y EJERCICIOS.

En un grupo de 6° grado con 36 estudiantes, se administra una técnica sociometríca de "adivina quién" para para evaluar el grado de relaciones positivas entre ellos para cada estudiante. Los valores para los 36 estudiantes fueron:

1. ¿Cual es el rango?

Rango=Xmáx - Xmín = 52 - 0=52

2. Construya una distribución de frecuencias no agrupada.


3. Construya una distribución de frecuencias agrupadas, con w= 5.



4. Construya un histograma de esos datos y comente sobre la forma de la distribución.



5. Construya una ojiva.


6. Estime Q1 y Q2.

Q1 = 2 o 3, Q3 = 13.5

7. Calcule la media.

9.78

8. Determine la mediana.

5

9. Determina la moda.


1

10. Compare la distancia de Q1 a Q2 con la distancia de Q2 a Q3. El patrón sugiere asimetría

Q3-Q2 es mayor que Q2-Q1. Positiva.

11. Para una decada reciente, el incremento en el ingreso medio en el sur fue 74 % para blancos y 113% para no blancos. ¿Cual es el incremento medio para ambos grupos combinados si de cada 100 trabajadores 82 fueron blancos?

Xmayor= X. =(n1X1+n2X2)/(n1+n2) [82(74) +18 (113)]/ 100=81%


12. Suponga que siete amigos viven junto a una autopista y quieren juntarse en la casa de uno de ellos para comer tacos y discutir las medidas de tendencia central y sus tipos favoritos de graficas. Si sus casas a lo largo de la autopista estan situadas de este a oeste en este orden A, B, C, D, E, F y G, ¿dónde deberían reunirse para minimizar la suma de las deviaciones?


Md en el punto D. (La suma de las derivaciones absolutas es un mínimo alrededor de la mediana).

13. Suponga que una distribución tiene una media de 70, una mediana de 65 y una moda de 55. ¿En que dirección esta sesgada la distrubución?



Esta sesgada a la derecha, es decir, positivamente.

14. Si aplica una prueba de CI a uan clase en dos ocaciones separadas, como regla general, comente sobre las diferencias relativas entre las dos medias, las dos medianas y las dos modas.


Se espera que las medias difieran menos y que las modas difieran más.


15. M0da= 50


16. Mediana= 51

viernes, 5 de septiembre de 2008

DISTRIBUCIÓNES DE FRECUENCIAS

DISTRIBUCIÓN DE FRECUENCIAS: Lista de valores de datos (ya sea de manera individual o por grupos de intervalos), junto con sus freciencias o conteos correspondientes.

LIMITE DE CLASES INFERIORES: Son las cifras mas pequeñas que puede pertener a las diferentes clases.

LIMITE DE CLASES SUPERIORES: Son las cifras mas grandes que pueden pertenecer a las diferentes clases.

FRONTERA DE CLASE: Son las cifras utilizadas para separar las clases. aun que sin los espacios creados por los limites de clase.

Se obtiene de la siguiente manera:

  • se determina el tamaño del espacio entre el limite de clase superior y el limite de clase inferior de la siguiente.

  • Se suma la mitad de esa cantidad a cada limite de clase superior para obtener las fronteras de clases superiores, se resta la mitad de esa cantidad de cada limite de clase

  • Visulaizacion de los datos.

HISTOGRAMA
Entre los distintos tipos de graficas que se presentan este es particularmente importante. Es una grafica de barras en donde la escala horizontal representa clases de valores de datos y la escala vertical representa la frecuencia. Las alturas de las barras corresponden a los valores de frecuencia.



  • Limites de clase inferiores: 0, 100, 200,300,400
  • Limites de clase superiores: 99, 199, 299, 399, 499
  • Primera clase: -05, 199.5, 299,5, 399.5, 499.5
  • Marca de clase: Son los puntos medios de las clases: 49.4, 149.5, 249.5, 349.5, 499.5
  • La anchura de clase: Es la diferencia entre dos limites de clase inferiores consecutivos.

  • Frontera de clase.

0.5 - 99.5

99.5 - 199.5

199.5 - 299.5

299.5 - 399.5

399.5 - 499.5



martes, 2 de septiembre de 2008

TAREA No. 3

Los datos corresponden a las utilidades en pesos de una panificadora (La conchita) durante cada uno de los ultimos 24 meses, los datos se dan tal cual se recogieron por eso aparecen en desorden. El dueño desea transpasar la panaderia y requiere conocer esos datos para tomar una decisión.





Cual es la pregunta del dueño de la panificadora?
  • Respuesta: Si debe o no de acuerdo a las ventas traspasar su tienda.


Cual es la poblacion bajo estudio. Describela.
  • Respuesta: Las ventas mensuañes de pan en dicha panaderia (La conchita)


Cual es la variable correspondiente.
  • Las ventas mensuales en la panaderia. (cantidad en pesos ganados)


Ordena los datos anteriores en una tabla de menor a mayor.





Cual es el menor dato y cual es el mayor.
  • Respuesta: 7814.8


Cual es la diferencia entre el dato mayor y el menor.
  • Respuesta: 21169.32 - 7814.8 = 13354.52


Cuales con los valores en el centro de los datos.







DISTRIBUCIÓN DE FRECUENCIAS

DISTRIBUCION DE FRECUENCIAS.

TOMA DE DATOS.
Los datos estadisticos generalmente son numericos. Con ellos se realiza el estudio de situaciones variadas en los mas diversos campos de la ciencia y la tecnologia, dicho estudio se refiere a situaciones en las cuales es indispesable obtener informacion confiable para tomar decisiones certeras en las cuales en gran medida se producen gracias a que los datos se organizan en tablas o graficas.

FUENTES DE DATOS ESTADISTICOS.
  • EXPERIMENTALES: Provienen de experimentos plateados y quizas controlados en algunas de las variables por un investigador.
  • POR OBSERVACION: No proceden experimentos sino de fuentes no controlables.
  • DATOS AGRUPADOS: Cuando se toman datos, estos aparecen sin orden por eso se les llaman datos en bruto o crudos. estos datos se pueden agrupar, ordenar de mayor a menor o de menor a mayor. Esto al menos permite saber cual es el dato mayor menor y cuales de estos estan en el centro, si sin pocos datos, si se repiten los datos es decir los mas frecuentes.

FRECUENCIA.

Es el numero de veces que se repite un dato, tambien se puede agrupar en tablas de frecuencia y frecuencias relativas. La agrupacion de estas tablas de hace mediante la distribucion de los datos numericos en clases segun sea su frecuencia.

lunes, 1 de septiembre de 2008

TAREA No. 2

Del siguente conjunto de datos obtener las definiciones de moda, mediana, media aritmetica; asi como el promedio por columna y obtener el promedio total de la siguiente tabla.






PROMEDIO POR COLUMNAS




PROMEDIO TOTAL DE LOS DATOS DE LA TABLA






MODA


MEDIANA