domingo, 27 de enero de 2008

TIPOS DE MUESTREO Y DETERMINACIÓN DE TAMAÑO DE MUESTRA.

Iniciando nuestra investigación hay que tener en cuenta los siguientes pasos:
1. Valorar las condiciones de estudio y tipo de información que podemos obtener (datos objetivos: archivos, base de datos, mediciones etc. o datos subjetivos: encuesta).
2. Definir el tipo de muestreo mas apropiado para nuestros datos.
3. Determinar tamaño de la muestra (para muestreos probabilísticas)
4. Estimar a los parámetros de la población (muestreo probabilístico) o hacer comentarios sobre la población (muestreo no probabilístico).
5. Realizar aplicaciones estadísticas: Estadísticos Descriptivos, Pruebas de Hipótesis, Análisis de Varianza, Análisis Factorial, Modelos Lineales, Diseño Experimental, Datos de Interés etc.
6. Analizar los resultados y hacer conclusiones.

En la actualidad, el tratamiento estadístico se realiza mediante varios programas estadísticos de computación especialmente preparados para ello. El estudio se va a realizar por medio de los programas SPSS (Statistical Package for the Social Sciences) y Microsoft EXCEL.
Es evidente que el investigador debe tener muy claro los objetivos de la investigación, los procedimientos estadísticos apropiados para las variables de estudio (datos) y cómo quiere los resultados.

Muestreo
Podemos definir dos tipos de poblaciones: poblaciones finitas y poblaciones infinitas. Población es finita cuando se conoce el tamaño total de elementos y población es infinita cuando no se conoce el tamaño o es imposible determinarlo.

La mayoría de las poblaciones son demasiado grandes para realizar una investigación e implican mucho tiempo, un equipo de trabajo enumerado y unos costos muy elevados lo que nos lleva a tomar una decisión de seleccionar una parte pequeña de la población llamada la muestra.

Para elegir una muestra es importante primero definir el tipo de Muestreo que se adapte a las condiciones de nuestro trabajo. Hay dos tipos de Muestreo: muestreo probabilístico (muestreo Aleatorio) o muestreo no probabilístico (muestreo no Aleatorio).

Muestreo probabilístico (muestreo Aleatorio): requiere de listado completo de los elementos que componen una población para que todos los elementos de la población tengan la misma probabilidad de ser incluidos en la muestra. Es indispensable determinar el tamaño de la muestra.
Este método es preferible porque los resultados obtenidos en la muestra son validos para estimar a los parámetros de la población (se estima que la población tiene aproximadamente el mismo
Muestreo no probabilístico (muestreo no Aleatorio): no requiere de listado de los elementos que componen una población, no se conoce la probabilidad de ser incluido en la muestra. No se determina el tamaño de la muestra ya que no existen pruebas de que tales muestras sean representativas de las poblaciones sobre las que se quiere hacer una estimación. Normalmente los estimadores obtenidos no serán muy parecidos a los parámetros de la población, por lo siguiente no se tiene en cuenta la determinación de tamaño de la muestra, simplemente hay que tratar de que sea representativa sin tratar de obtener cantidades que se correspondan con las proporciones de la población. Se busca tener la suficiente información para poder hacer comentarios sobre la población.
Los resultados obtenidos solo son validos para esos determinadas condiciones en el momento actual.

comportamiento el que hallamos en la
muestra).

Las formas más conocidas muestreo probabilístico:

Muestreo aleatorio simple
Cada elemento de la muestra debe tener la misma y conocida probabilidad de ser seleccionado. Se trata de hacer una lista completa y enumerada de la población. Asignar, fijar y ordenar los números aleatorios mediante una tabla o una función generadora de números aleatorios por computadora, por medio de los cuales se seleccionan los elementos que van a formar la muestra. (Ejemplo: seleccionar un grupo o una muestra de estudiantes del total de matriculados en la facultad de ingeniería).

Muestreo, aleatorio sistemático
En una lista completa se selecciona al azar el primer elemento al cual se suma sucesivamente el número fijo que representa el tamaño del intervalo hallándose por medio de: N/n (siendo N el tamaño de la población y n el tamaño de la muestra) hasta obtener los demás elementos hasta completar el tamaño de la muestra. (Ejemplo: Tamaño del intervalo= N/n=100/20=5. Cada quinto dato a partir del primer elemento elegido entrará a la muestra hasta completar 20 datos).

Muestreo aleatorio estratificado
Este método consiste en dividir la población en estratos o grupos homogéneos y luego tomar una muestra aleatoria simple de cada grupo o estrato. Es preferible, en cuanto sea posible, usar la misma fracción de muestreo dentro de los estratos, realizando un muestreo aleatorio estratificado proporcionado; en el caso contrario se usan diferentes fracciones de muestreo en los estratos y se denomina como muestreo aleatorio estratificado desproporcionado. (Ejemplo: seleccionar de a un grupo o de a una muestra de estudiantes matriculados en cada ingeniería en particular: Ambiental, Sistemas, Industrial, etc.).

Muestreo aleatorio por conglomerados
Es muy similar al muestreo estratificado. Para superar las dificultades del muestreo realizado sobre una población en una amplia o dispersa área geográfica, ésta se divide en unidades relativamente pequeñas llamadas conglomerados (en general siguiendo los límites geográficos o áreas de interés para la investigación), seleccionando una muestra aleatoria de conglomerados. Al estudio entran todos los elementos que componen cada conglomerado elegido. (Ejemplo: distritos, barrios o una zona silvestre en varias áreas compactas).


Las siguientes formas son más utilizadas en muestreo no probabilístico:
Muestreo intencional o por conveniencia:
Las unidades de muestreo son accesibles, convenientes y fáciles de medir. Se seleccionan casos típicos de una población, actuando en forma intencional, a criterio de un experto. Se puede obtener una gran cantidad de encuestas con rapidez, verificando antes de encuestar si cumple con los criterios que hemos establecido.

Muestreo casual
Se trata de entrevistar a personas de forma casual, sea en la calle o por teléfono. También se utiliza por las televisiones, radios y empresas de investigación de mercado.
Muestreo por cuotas
Hay que decidir las características específicas sobre las que se basarán las cuotas (como ser edad, religión, educación, adultos, niños, etc.). Se especifica la cantidad de unidades o de entrevistas a realizar a personas que reúnan determinadas características (por ejemplo: hombres, educación superior, casados, entre 30 y 35 años).



Determinación del tamaño de la muestra (Muestreo Probabilístico o Aleatorio):

• Para una población infinita:
a) n = z2 pq/e2 (np  5 y nq  5)
b) n = 1/e2 (al sustituir en (a) por:  = 0,05, el valor de z = 1,96  2, y p = q = 0,5).

Ejemplo:
Para (b) si aceptamos e = 0.05: n = 1/(0.052 ) = 400
e = 0.07: n = 1/(0.072 ) = 204
e = 0.10: n = 1/(0.102 ) = 100
e = 0.12: n = 1/(0.122 ) = 69


• Para una población finita:
a) n = Nz2 pq/[e2 (N - 1) + z2 pq] (np  5 y nq  5)
b) n = N/[e2 (N -1) +1] (al sustituir en (a) por:  = 0,05, el valor de z = 1,96  2, y p = q = 0,5).

Ejemplo:
Para (b) si aceptamos: e = 0.05 y N = 500: n = 500/[ 0.052 (500 – 1) + 1]) = 222
e = 0.10 y N = 500: n = 500/[ 0.102 (500 – 1) + 1]) = 83
e = 0.10 y N = 1000: n = 1000/[ 0.102 (1000 – 1) + 1]) = 91

Donde:
N - tamaño de la población.
n - tamaño de la muestra.
p - probabilidad de éxito, proporción de la variable de interés (se obtiene de los estudios anteriores sobre el mismo tema o de realización de una prueba piloto con una muestra pequeña, estimando el valor de p o se acepta que p = q = 0,5 si no se tiene ninguna información).
q = (1 – p) - probabilidad de fracaso.
 - el nivel de confianza elegido.
Z el valor de z.
e - error de la estimación: 1%, 2%, 5%, 10% etc. (se aplican diferentes márgenes de error para determinar el tamaño de la muestra; entre mas grande aceptamos el error mas pequeña será la muestra).

DISTRIBUCION DE FRECUENCIAS.

FACULTAD DE INGENIERÍA


Asignatura: ESTADISTICA DESCRIPTIVA
Profesora: ALLA GUTIERREZ

TEMA: DISTRIBUCIÓN DE FRECUENCIAS

Fecha: 2011


Objetivo:

Profundizar y afianzar los conocimientos estadísticos creando un ambiente de acceso relativamente sencillo a los programas estadísticos, utilizando un enfoque pedagógico al proporcionar una explicación del uso del programa, desarrollando nuevas habilidades en el estudiante que satisfacen en la necesidad de resolver problemas de la realidad y investigación.



Introducción:

La estadística desempeña un importante papel en todas las áreas de investigación y la toma de decisiones de nivel empresarial. Proporciona herramientas que le permitan al ingeniero plantear modelos que faciliten la tarea de investigación y proyección de las actividades futuras.
Fortaleciendo las bases fundamentales de la Estadística con el uso de programas estadísticos y las hojas de cálculo, forma parte integral del proceso de aprendizaje, motivando a los estudiantes y elevando su nivel de conocimiento que lo llevara a ser un profesional eficiente.


Competencias a desarrollar: Interpretativa

Capacidad de reconocer conceptos básicos de la estadística, calculando, aplicando y analizando medidas de tendencia central y de dispersión.

Capacidad para comprender la importancia de la estadística como herramienta de investigación, análisis e intervención de la Ingeniería Ambiental en la solución de problemas de la comunidad y su entorno ambiental.




Metodología:

Inducción: Resolver los ejercicios propuestos analizando resultados de acuerdo a las propiedades y conceptos básicos de la estadística.
Profundización: Prácticas en la sala de computo utilizando Statgraphics o Excel.


Trabajo individual:
Realización del Taller.

Perfeccionamiento:
Buscar información y/o datos reales relacionados con Ing. Ambiental,(mínimo 50 datos) de una variable continua.
Plantear el problema y objetivo.
Realizar el análisis de los resultados y presentar conclusiones.


Socialización:
Individual o en parejas.

Evaluación:

Presentación de informe: Individual o en parejas.


Bibliografía

CHAO Lincoln. Estadística para las ciencias administrativas. Mc Graw Hill.
MARTÍNEZ B, Ciro. Estadística: Apuntes y 600 problemas resueltos.
WEBSTER L. Allen. Estadística Aplicada a los negocios y la economía. Mc Graw Hill.



Ejercicios Propuestos: DISTRIBUCION DE FRECUENCIAS.

VARIABLE DISCRETA

1. No. de hijos por familia (Realizar una encuesta en el salón de clase).
a) Organizar los datos obtenidos en una tabla da frecuencias.
b) Graficar diagramas de frecuencias absolutas, relativas, absolutas acumuladas y relativas acumuladas.

2. Con el siguiente texto organice una tabla de frecuencias, según el número de letras que componen cada palabra. Grafique los diagramas correspondientes.

La motivación es necesaria para que ocurran las respuestas y, por lo tanto, afecta indirectamente a lo que se aplica y aprende, pero, el aprendizaje en sí no requiere de motivación. En gran medida, el compromiso más importante es el de la persona. El éxito o el fracaso de su disposición a ser un gran hombre, parte de él mismo.

3. Los siguientes datos corresponden al número de piezas defectuosas por cada mil artículos hallados en la revisión del control de calidad en una fábrica:
5 2 9 6 4 2 7 6 11 5 8 3 6 9 11 4 7
7 9 8 5 3 7 9 8 7 5 4 5 7 5 6 7 9
5 7 7 5 5 3 7

a) Organizar los datos obtenidos en una tabla da frecuencias.
b) Graficar los diagramas de frecuencias absolutas, relativas, absolutas acumuladas y relativas acumuladas.


VARIABLE CONTINUA

4. Realizar una encuesta en el salón de clase, tomando como datos la ESTATURA de los estudiantes del grupo.
a) Organizar los datos obtenidos en una tabla da frecuencias.
b) Graficar Histograma de frecuencias absolutas y relativas, Polígono de frecuencias y Polígono (Ojiva) de frecuencias absolutas acumuladas y relativas acumuladas.


5. Realizar una encuesta en el salón de clase, tomando como datos el PESO de los estudiantes del grupo.
a) Organizar los datos obtenidos en una tabla da frecuencias.
b) Graficar Histograma de frecuencias absolutas y relativas, Polígono de frecuencias y Polígono (Ojiva) de frecuencias absolutas acumuladas y relativas acumuladas.

6. Saldos promedios ( en miles de pesos) de las cuentas que se cancelan antes de cumplir un año :

8 12 17 21 25 29 33 49
32 44 51 34 59 63 37 43
39 65 73 57 83 89 68 95
46 86 54 76 61 48 55 52
59 77 79

a) Organizar los datos en una tabla da frecuencias.
b) Graficar Histograma de frecuencias absolutas y relativas, Polígono de frecuencias y Polígono (Ojiva) de frecuencias absolutas acumuladas y relativas acumuladas.

7. Areas en metros cuadrados, de salones de clase de una universidad:

20.4 23.8 28.6 43.7 43.3 39.4 25.6
28.9 29.3 31.6 28.8 48.0 40.7 29.5
31.9 32.1 32.9 31.6 31.8 28.9 28.3
33.4 33.7 43.6 33.0 33.3 34.0 30.1
38.2 39.0 34.7 34.8 35.0 32.3 32.8

a) Organizar los datos en una tabla da frecuencias.
b) Graficar Histograma de frecuencias absolutas y relativas, Polígono de frecuencias y Polígono (Ojiva) de frecuencias absolutas acumuladas y relativas acumuladas.


MEDIDAS DE TENDENCIA CENTRAL

8. Con los siguientes datos, no agrupados, calcular media aritmética, mediana y moda:
a) 5 2 9 6 4 2 7
b) 7 9 8 5 3 7 9 8 7 5
c) 33.4 34.0 33.8 34.7 34.3 33.7 34.0 34.9

9. Con los datos agrupados, de los ejercicios 1 a 7, calcular media aritmética, mediana y moda; cuartiles, deciles y percentiles.


MEDIDAS DE DISPERSION

10. Con los datos del ejercicio 8, calcular varianza y desviación estándar.

11. Con los datos agrupados de los ejercicios 1 a 7, calcular varianza, desviación estándar, intervalos de confianza y coeficiente de variación.



TALLER


Los siguientes datos corresponden a los tiempos (en minutos) de utilización de Internet de una cuenta particular.

6.12 14.08 5.45 47.21 12.51 97.15 42.36
48.02 12.13 10.10 57.23 39.18 68.47 39.25
25.00 32.00 7.21 28.31 25.07 58.45 45.56
37.05 19.15 18.52 47.34 53.12 67.32 47.46
13.08 72.01 18.54 16.35 11.48 57.31 33.23
18.10 32.09 15.23 35.11 10.25 46.20 46.21
18.00 8.12 25.48 22.28 49.56 59.35 41.02
13.50 7.14 27.33 48.15 11.21 53.23 37.54
12.30 46.11 33.29 7.17 34.11 86.25 33.32
13.15 28.15 34.45 34.49 13.00 32.51

Sin utilizar programas de computador:

a) Organizar los datos en una tabla da frecuencias.
b) Calcular las medidas de tendencia central y Asimetría.
c) Calcular las medidas de dispersión y Curtosis..
d) Graficar Histograma de frecuencias absolutas y relativas, Polígono de frecuencias y Ojiva de frecuencias absolutas acumuladas y relativas acumuladas.
e) Resumir y analizar los resultados obtenidos.




TRABAJO INDIVIDUAL: DISTRIBUCIÓN DE FRECUENCIAS


Buscar información y/o datos reales (mínimo 50 datos) de una variable continua.

¡Presentar la Fotocopia o el original de fuente de los datos!

Sin utilizar programas de computador:
a) Plantear el problema y objetivo.
b) Organizar los datos en una tabla da frecuencias.
c) Calcular las medidas de tendencia central y Asimetría (Interpretar cada resultado).
d) Calcular las medidas de dispersión y Curtosis (Interpretar cada resultado).
e) Graficar Histograma de frecuencias relativas, Polígono de frecuencias y Ojiva de frecuencias relativas acumuladas.
f) Analizar los resultados obtenidos.



Práctica STATGRAPHICS O EXCEL:

Verificar los resultados obtenidos con el uso del programa STATGRAPHICS o Excel en la sala de cómputo con la asesoría del profesor.





GUIA STATGRAPHICS: Distribución de frecuencias.
Frequency Tabulation


Paso 1: INICIO ® Programas ® STATGRAPHICS Plus 5.1 ® Sgwin

Paso 2: StatWizard
· Analyze Existing Data or Enter New Data Enter

Paso 3: StatWizard – Data localition

· I Want to Enter New Data Enter

Paso 4: STATGRAPHICS Plus
ACEPTAR Enter

Paso 5: Modify Column
Name: Col 1
Type
· Numeric Enter

Paso 6: Entrar Datos en la Col 1

Paso 7: Describe ® Numeric Data ® One-Variable Analysis Enter
¯
Summary Statistics Options Enter
 Average ΠMin
ð Median ð Max
ð Mode ð Range
ð Variance
ð Std. Deviation Enter

Paso 8: One-Variable Analysis

Col 1 ¨ Col 1
­ ­
Enter Enter

Paso 9: Ver resumen
Ver gráficas

CONCEPTOS BASICOS DE ESTADISTICA.

FACULTAD DE INGENIERÍA

Asignatura: ESTADISTICA DESCRIPTIVA
Profesora: ALLA GUTIERREZ


TEMA: GENERALIDADES DE LA ESTADÍSTICA

Fecha: 2011


Objetivo:
Leer y analizar los conceptos básicos que le permitan al estudiante
reconocer el significado de la estadística, explicar lo que significa estadística descriptiva y estadística inferencial, diferenciar entre una variable cuantitativa y una variable cualitativa, distinguir entre una variable discreta y una variable continua.



Introducción:

La estadística es un conjunto de teorías y métodos que han sido desarrollados para tratar la recolección, el análisis y la descripción de datos muestrales con el fin de extraer conclusiones útiles, su función primordial es apoyar al investigador al decidir sobre el parámetro de la población de que procede la muestra.

Competencias a desarrollar: Interpretativa

Capacidad de reconocer conceptos básicos de la estadística, explicar lo que significa estadística descriptiva y estadística inferencial y su entorno ambiental.

Capacidad para comprender la importancia de la estadística como herramienta de investigación, análisis e intervención de la Ingeniería Ambiental en la solución de problemas de la comunidad y su entorno ambiental.

Metodología:
Inducción: Leer la Historia y Generalidades analizando los conceptos básicos de la estadística.
Profundización: En la parte final de la guía encuentras una serie de ejercicios, los cuales hay que responder de la forma propuesta.

Trabajo individual:
Leer la Historia y Generalidades analizando los conceptos básicos de la estadística. Responder los ejercicios propuestos.

Perfeccionamiento:
Discusión y análisis en grupos de los términos y conceptos básicos consultados y ejercicios resueltos.
Buscar los ejemplos en la solución de problemas de la comunidad y su entorno ambiental.



Socialización:
Cada grupo se encarga de responder de a varias preguntas abriendo discusión entre opiniones de los demás grupos.

Evaluación:

· Participación en clase
· Presentación de informe: en grupos


Bibliografía

CHAO Lincoln. Estadística para las ciencias administrativas. Mc Graw Hill.
MARTÍNEZ B, Ciro. Estadística: Apuntes y 600 problemas resueltos.
WEBSTER L. Allen. Estadística Aplicada a los negocios y la economía. Mc Graw Hill.





HISTORIA

El estudio de la Estadística ha sufrido cambios sustanciales desde sus comienzos. Merecen mención especial dos fuentes de tendencias de desarrollo. Primeramente, el origen de la Estadística puede advertirse ya en la necesidad de datos numéricos en los estados que surgían de la sociedad medieval en la Europa Occidental. Al transformarse la sociedad medieval en el estado político, el nuevo gobierno necesitaba información sobre los recursos del país para poder tener éxito. Así pues era obligado para los nuevos gobernantes el obtener descripciones numéricas, tales como el número de ciudadanos de las diversas unidades políticas bajo su jurisdicción: ciudades, condados y provincias. El término Estadística, que se deriva del latín status, que significa estado en el sentido político, se empleo entonces para referirse a la recolección y descripción de tales datos del estado. La necesidad de acopiar y analizar datos numéricos impulsó a desarrollar métodos para facilitar la labor, que era lo que constituía lo más considerable de la Estadística hasta la era moderna.

No es necesario enumerar todos los que contribuyeron al desarrollo de los métodos estadísticos. Pero se ha de mencionar sin embargo al belga Adolph Quetelet (1796 - 1874), que fue el primero en aplicar métodos modernos a conjuntos de datos. Suele llamarse a Quetelet "padre de la Estadística moderna" por su continua insistencia en la importancia de aplicar métodos estadísticos. Sus distinguidas contribuciones a la práctica y a la metodología estadísticas cubrieron muchos campos de la estadística oficial, tales como los censos, el desarrollo de la uniformidad y comparabilidad de estadísticas entre las naciones, y la organización de la primera conferencia Estadística internacional, La Comisión Central de Estadística, que Quetelet fundó, fue el modelo para instituciones similares en otros países.

Otra fuente de la Estadística se encuentra en la atención prestada al juego en el siglo XVII. Debido a la tolerancia y al prestigio de que disfrutaban varias formas de juegos para recreación de la nobleza de Inglaterra y Francia durante este período, se suscitó un interés intenso por los juegos de azar, cosa que sin proponérselo, llevó al desarrollo de la teoría de las Probabilidades. Y entre tanto, existía ya una tecnología lo bastante avanzada como para suministrar dispositivos para juegos, tales como dados y cartas, con suficiente refinamiento como para desafiar la aguda imaginación del matemático. El jugador depende del azar o posibilidad de error asociada a una línea de acción dada; el resultado efectivo de una prueba es cosa desconocida, pero la teoría de las Probabilidades da el número esperado de ocurrencia de un suceso particular en un número muy elevado de pruebas. La Estadística moderna se interesa enormemente por dicha teoría.

Al mismo tiempo, los estudios de Probabilidades requerían el tratamiento matemático de los errores en las mediciones, de lo que resultaron teorías y métodos desarrollados para describir las configuraciones de distribución de tales errores. Ya desde el siglo XVIII se había observado que las medidas repetidas de un cierto objeto o fenómeno daban lugar a una configuración en la distribución de los errores que tenía la forma de una curva acampanada. La curva es simétrica con respecto al valor verdadero, lo cual significa valor de error nulo, que queda en el centro. Es simétrica porque las desviaciones negativas y positivas respecto del centro son iguales en magnitud y frecuencia. Cuanto mayores las derivaciones menores serán las frecuencias.

A propósito de la evaluación de los errores de observación en astronomía, se hizo un descubrimiento de importancia mayor para la estadística. La distribución de errores resultante con su forma de campana Y su simetría se llama curva normal de errores. También se dice distribución gaussiana de errores, por el nombre de su descubridor Karl Frierich Gauss (1777 - 1855).

Entre los contemporáneos de Quetelet y Gauss que contribuyeron al avance de la estadística como ciencia estaban Florence Nightingale (1820 - 1910) Y Francis Galton (1822 - 1911). Florence Nightingale creía firmemente en los métodos Estadísticos. Sostenía que todo director debería guiarse por el conocimiento estadístico si quería tener éxito y que los políticos y los legisladores fracasaban frecuentemente por la insuficiencia de sus conocimientos estadísticos. Galton, como su primo Charles Darwin, se interesó profundamente en el estudio de la herencia, a la cual aplicó métodos estadísticos. Entre sus principales contribuciones se encuentra el haber desarrollado métodos tan fundamentales como la regresión y la correlación.

La obra de Galton fue estímulo para una serie de investigaciones de Karl Pearson (1857 -1936), el cual inició la publicación del periódico Bíométrica, que ha influido profundamente en el desarrollo de la estadística. Muchos de los métodos Estadísticos fueron descubiertos por Pearson, siendo el más importante la distribución ji - cuadrado, que encontró en 1990.

En el siglo XX, quienes han contribuido de manera más descollante al estudio de la estadística han sido William S. Gosset (1876 - 1937) Y Sir Ronald Fisher (1890 - 1962). Gosset, que escribía bajo el seudónimo "Student", dedujo la distribución t y su contribución especial fue en el campo de la teoría de pequeñas muestras. Fisher halló conocida distribución F y aportó contribuciones continuamente hasta 1962, muchas de ellas han tenido grande influencia en los modernos procedimientos Estadísticos. Si bien su trabajo era sobre todo en los campos de la biología, genética y agricultura, su impacto ha llegado a todas las aplicaciones de la Estadística.


GENERALIDADES

En la vida diaria los diversos fenómenos de orden económico, social, político, educacional, e incluso biológico, aparecen, se transforman, y finalmente desaparecen. Para tan abundante y complejo material es preciso tener un registro ordenado y continuo de conseguir en un momento dado los datos necesarios para un estudio de lo que ha sucedido, sucede o puede suceder.

Para ello es necesario contar con un método, con un conjunto de reglas o principios, que permitan la observación, el ordenamiento, la cuantificación y el análisis de dichos fenómenos. Ese método es el que se denomina ESTADÍSTICA.

La palabra ESTADÍSTICA se refiere a un sistema o método científico usado en la recolección, organización, análisis, interpretación numérica de la información. También se puede decir que la ESTADÍSTICA estudia el comportamiento de los fenómenos de grupo.

Hay dos fases en el campo de la Estadística. En primer lugar, está la fase que solo se limita a la descripción y análisis de una serie de datos sin llegar a conclusiones o generalizar con resultados a un grupo mayor. Esta (fase) se conoce como Estadística deductiva o descriptiva. En segundo lugar esta la fase que trata de llegar a conclusiones acerca de un grupo mayor basada en información de un grupo menor o muestra: es esta la estadística inductiva o inferencial. Las conclusiones a que se llega respecto a la población o universo, se exponen en términos probabilísticos, sin estar completamente seguros de estas inferencias.

Desde el punto de vista descriptivo analítico, la Estadística se define como un conjunto sistemático de procedimientos para observar y describir numéricamente los fenómenos, descubrir las leyes que regulan la aparición, transformación y desaparición de los mismos.

Generalmente se asocia la palabra ESTADISTICA con cifras sobre algún campo particular. Podemos asociarla sobre el número de nacimientos, defunciones, transacciones comerciales, valor de las acciones en el mercado de valores, el volumen físico y monetario o importaciones, el beneficio y utilidad de las empresas o la demanda presente o potenciar algún producto. Cuando usamos la palabra Estadística es para referirnos más bien a datos tabulados y ordenadamente presentados.

FENÓMENOS QUE ABARCA Y NO ABARCA LA ESTADÍSTICA

Los fenómenos o hechos que continuamente suelen suceder presentan ciertas características tales como las de ser observados y manifestarse al exterior mediante registros, al mismo tiempo el de cuantificarse y aun el de poder determinar la intensidad con que se produce cierto fenómeno.

El campo de acción de la Estadística es muy amplio, sin embargo, no todos los fenómenos son abarcados. Únicamente aquellos que reúnen ciertas condiciones a saber:
1. Fenómenos colectivos o de grupos.
2. Fenómenos de frecuente repetición.
3. Fenómenos de distinta frecuencia.
4. Fenómenos distantes en el espacio.
5. Fenómenos distantes en el tiempo.
6. Fenómenos cualitativos que puedan cuantificarse.

En cambio quedan fuera del campo de acción de la Estadística, los enumerados a continuación.
1. Fenómenos individuales.
2. Fenómenos que no se exteriorizan.
3. Fenómenos accidentales en el tiempo y en el espacio.
4. Fenómenos cualitativos que no puedan cuantificarse.

FINALIDADES DE LA ESTADÍSTICA

Son numerosas las finalidades de Estadística; entre las más importantes podemos anotar:
1. Conocer la realidad acerca de un fenómeno.
2. Determinar lo normal o típico de un fenómeno.
3. Determinar los cambios que presentan los fenómenos.
4. Relacionar dos o más fenómenos.
5. Determinar las causas que originan el fenómeno.
6. Hacer estimaciones sobre el comportamiento futuro.
7. Partiendo de un grupo menor obtener conclusiones para un grupo mayor.

VARIABLE Y TIPO DE VARIABLES

En esta sección revisaremos algunos conceptos que se utilizarán extensamente en esta guía. Con el propósito de no crear en el estudiante un estado de desaliento, resultado de la confusión propia cuando se empiezan a manejar conceptos abstractos, hemos preferido dejar de lado el excesivo formalismo, presentar las ideas de la manera más simple posible y procurando que queden lo más adecuadas al lenguaje Estadístico.

Variable. Es toda característica que toma diferentes valores en distintas personas, lugares o cosas. Por ejemplo, la estatura de las personas, el número de personas que residen en una vivienda, el sexo de los estudiantes de la universidad.

Datos. Son números o medidas que han sido recopilados como resultados de observaciones. Los datos pueden provenir de recuentos tales como el número de personas que laboran en una empresa o de mediciones como el peso de una persona.

Variable aleatoria. Cuando los valores que asume la variable han sido antecedidos por una selección aleatoria de los objetos medidos o son resultados de algún proceso al azar. A las variables aleatorias usualmente se les denota por letras X. Y, Z; y a los valores por las respectivas minúsculas.

Si de las cuentas corrientes de los clientes de un banco se escogen cinco al azar en un día determinado, la variable depósito en cuenta corriente de cada cliente constituye una variable aleatoria que podemos designar X. Si alguna de las cuentas aparece con un registro o saldo de 1.000.000 de pesos entonces x = 1.000.000.

Variable continua. Es aquella que teóricamente puede tomar cualquier valor dentro de un intervalo. Por ejemplo, la estatura de las personas o el tiempo necesario para realizar una transacción bancaria de parte del cliente.

Variable discreta. Es aquella que toma valores separados entre sí por alguna cantidad. Por ejemplo, el número de personas que llegan en una hora a un banco a solicitar un servicio.

Variable cuantitativa. Es aquella que asume valores acompañados de una unidad de medida. Por ejemplo, el número de accidentes anuales ocurridos en una carretera de mucha circulación o el ingreso por familia en determinados sectores de la ciudad.

Variable cualitativa. Es la que se refiere a clasificación, como estado civil, preferencia por una marca, etc.


COMPONENTES DE UNA INVESTIGACIÓN ESTADÍSTICA -

El estudio estadístico de una situación con propósitos inferenciales se centra en dos conceptos fundamentales: población y muestra, los cuales serán definidos a continuación.

Población. Es el conjunto formado por todos los valores posibles que puede asumir, la variable objeto de estudio.

Así por ejemplo, en un estudio sobre la preferencia de los votantes en una elección presidencial, la población consiste en todas las respuestas de los votantes registrados. Pero el término no sólo está asociado a la colección de seres humanos u organismos vivos; y tenemos así que, si se va a hacer una investigación de las ventas anuales de los supermercados, entonces las ventas anuales de todos los supermercados constituyen así mismo la población.

Es bueno tener en cuenta que el término población se interpreta de dos maneras cuando se hace un estudio estadístico, a saber:
La interpretación propia en el Análisis Estadístico, que corresponde a la que hemos presentado anteriormente.
Como el conjunto de objetos sobre los cuales actúa la variable considerada.

Por tanto, no es extraño escuchar expresiones tales como, "se hizo un estudio de los niveles de ingreso de la población trabajadora colombiana", entendiéndose con ello que el elemento estadístico objeto de análisis fue el registro numérico de los ingresos.

Muestra. Es cualquier subconjunto de la población, escogido al seguir ciertos criterios de selección.

La muestra es el elemento básico sobre el cual se fundamenta la posterior inferencia acerca de la población de donde se ha tomado. Por ello, su escogencia y selección debe hacerse siguiendo ciertos procedimientos que son ampliamente tratados en la parte de la estadística llamada Teoría de muestreo.

El concepto de muestra tiene también las dos connotaciones que hemos señalado para la población.

Las características de una población se resumen para su estudio generalmente irá mediante lo que se denominan parámetros; éstos a su vez se toman o consideran como valores verdaderos de la característica estudiada. Por ejemplo, la proporción de todos los clientes que declaran cierta preferencia por una marca particular de un producto dado, es un parámetro de la población de todos los clientes; es la verdadera proporción de la población. Igualmente, la media aritmética de las cuentas corrientes de los clientes de un banco determinado constituye un parámetro de la población de las cuentas de los clientes de ese banco.

Cuando la característica de la población estudiada se reduce a una muestra el resumen de esa característica se hace mediante una esta (medida) o estadígrafo. Así por ejemplo. si se toman 100 de todos los posibles clientes y se les entrevista para ver si están a favor de una marca particular de un producto, estos 100 clientes la constituyen una muestra.. Si hay 70 clientes que prefieren dicha marca entonces la proporción muestral será 0.70 y constituirá un estadígrafo; de igual manera si se escogen 1,000 cuentas del total de las cuentas comentes; las 1,000 observaciones conforman una muestra y el promedio aritmético de estas cuentas un estimador.

La inferencia estadística se orienta a sacar conclusiones acerca del parámetro o parámetros poblacionales con base en el valor de un estimador obtenido a partir de los datos muestrales extraídos de esa población. Para llegar a ese objetivo a través de un proceso racional y eficaz, se aconseja que se tengan en cuenta los siguientes pasos:

Formulación del problema. En este punto se debe especificar de manera clara la pregunta que se debe responder y la población de datos asociada a la pregunta. Los conceptos deben ser precisos y deben ponerse limitaciones adecuadas al problema motivadas por el tiempo, dinero disponible y la habilidad de los Investigadores. Algunos conceptos como, artículo defectuoso, económico, salario, pueden variar en cada caso y para cada problema debemos coincidir con las ideas señaladas en el estudio.

Diseño del experimento. Este aspecto es de gran importancia, puesto que la recolección de datos requiere dinero y tiempo. Es siempre nuestro deseo obtener máxima Información con el mínimo costo (dinero y tiempo) posible. Incluir excesiva Información en la muestra es a menudo costoso y antieconómico. Incluir poca también es poco satisfactorio. Esto implica, entre otras cosas, que debemos determinar el tamaño de la muestra o la cantidad o tipo de datos que nos permita resolver el problema de la manera más eficiente.

Recolección de datos. Esta parte, por lo general, es la que exige más tiempo en la Investigación. Esta recolección debe ajustarse a reglas estrictas ya que de los datos esperamos extraer la Información deseada.

Tabulación y descripción de los resultados. En esta etapa, los datos muestrales se exponen de manera clara y se ilustran con representaciones tabulares y gráficas (diagramas. histogramas, etc.); además se calculan las medidas estadísticas apropiadas al proceso inferencial que haya sido escogido.

Inferencia estadística y conclusiones. Este último paso constituye tal vez la contribución más importante de la estadística al proceso inferencial. Aquí se fija el nivel de confiabilidad para la inferencia; esto es debido a que las conclusiones derivadas de inferencias estadísticas jamás se pueden tomar con un 100% de certeza, pero sí se les puede asociar un nivel de confiabilidad; en términos de probabilidad denominados nivel de confianza y nivel de significancia. El proceso Inferencial nos llevará a una conclusión estadística que servirá de orientación a quien o quienes deban tomar la decisión (administrativa o clínica) sobre el tema objeto de estudio.



EJERCICIOS PROPUESTOS: GENERALIDADES DE LA ESTADÍSTICA

1. Clasifique cada una de las variables (cuantitativa. cualitativa. discreta. continua) asociada a las características indicadas.
a. Distancia diaria recorrida por cada estudiante para ir de su casa a la universidad.
b. Tiempo que requiere un estudiante para responder a un examen de Estadística.
c. Llamadas que llegan al conmutador de una empresa durante un día.
d. Color del cabello de los estudiantes de sexo femenino que toman el curso de estadística en el presente semestre.
e. Preferencia por cierta marca de gaseosa.
f. Estatura de los estudiantes de sexo masculino que pertenecen al equipo de básquetbol.

2. En cuáles de los siguientes casos la variable considerada es de carácter aleatorio:

a. El médico de la universidad registra el peso de los estudiantes que Ingresan este semestre a la universidad.
b. El médico de la universidad cita a todos los estudiantes que ingresan este semestre; de ellos escoge aleatoriamente 50 y registra el peso de cada uno de ellos.
c. El contador de una empresa registra el saldo bancario que ésta ha mantenido durante los días del último año.
d. El contador de una empresa registra el saldo bancario que ésta ha mantenido durante 45 días del último año, escogidos al azar.

3. Se ha hecho un estudio para determinar la preferencia de una marca especial de detergente por parte de las amas de casa; Entre las 50 amas de casa entrevistadas. 30 dijeron que preferían esta marca.
a. ¿Qué constituye la muestra?
b. ¿Qué constituye la población?

5. Un informe reciente en la revista Fortune reveló que los japoneses pronto controlarán hasta un 35% de las ventas de autos en los Estados Unidos; comparado con el 28% de finales de los años 80 está apenas un 8% por encima de lo ocurrido en 1970. ¿Esta información contiene estadística descriptiva, inferencial, o ambas? Explique.

7. La revista Forbes (febrero de 1997) reportó datos sobre las condiciones y estilos de vida en varias ciudades de Colombia. Algunas de esos datos se reproducen aquí.

CIUDAD
POBLACIÓN EN MILLONES
MEDIANA DE INGRESOS POR HOGAR
MEJOR NEGOCIO HOTELERO
ATRACCIÓN MÁS VISITADA
TASA DE CRIMINALIDAD POR CADA 100.000
CALI
3.5
420000
TONE
PARQUE DE LA CAÑA
846.2
CARTAGENA
2.5
450000
DECAMERON
SAN FELIPE
1296.5
BARRANQUILLLA
2.5
375000
IROTAMA
PUENTE PUMAREJO
263.4
MANIZALES
5.0
301000
CALDAS
NEVADO DEL RUIZ
693.1
SAN ANDRÉS
1.0
750000
SAN LUIS
JHONNY KEY
634.9

a. Identifique las variables cualitativas y cuantitativas.
b. ¿Cuáles variables son discretas y cuáles continuas?
c. Identifique cada variable como nominal, ordinal, o de razón.
d. ¿Cuáles son descriptivas y cuáles inferenciales?

8. Un ejemplo de características cualitativa pueden ser datos sobre:

a. Salarios
b. Pulsaciones por minuto
c. Gastos mensuales en alimentación
d. Ocupación
e. Temperatura

9. Una muestra es aleatoria cuando las unidades se seleccionan:

a. En forma caprichosa.
b. Por conveniencia.
c. A través de un censo.
d. En forma repetitiva.
e. De tal manera que todas tengan la misma posibilidad.

10. Por población o universo se entiende:

a. Un recuento de unidades.
b. Un conjunto de seres humanos.
c. Un conjunto de datos.
d. Un conjunto de medidas o el recuento de todas las unidades que tienen una característica común.
e. Ninguna de las anteriores.


11. Cualquier medida aplicada a la característica de las unidades en la población se denomina:

a. Parámetro.
b. Estimador.
c. Estadístico.
d. Variable.
e. Población.

12. Dentro de los hechos o fenómenos que no caen dentro del campo de la estadística están:

a. Los de frecuente repetición.
b. Los de distinta frecuencia.
c. Los colectivos.
d. Los individuales.
e, Los cualitativos que pueden cuantificarse

13. La estadística descriptiva tiene como objetivo:

a. Probar la significación de los resultados.
b. Ser herramienta indispensable en el muestreo.
c. Descubrir las causas que originan el hecho.
d. Lograr conclusiones más allá de las muestras
e. Efectuar comparaciones sin sacar conclusiones de tipo más general.

14. Se debe responder verdadero si el enunciado es siempre válido. En caso contrario se deberá sustituir la palabra subrayada por otra, con la cual el enunciado tenga validez.

a. Parámetro es el resultado al aplicar una medida a las características de las unidades de una población.
b. El recuento de los empleados de una empresa, de acuerdo al cargo, es un ejemplo de características cuantitativas.
c. La estadística Descriptiva es el «estudio» de una muestra a fin de poder hacer estimaciones acerca de los estadísticos de la población, de la cual se tomó la muestra.
d. Una muestra aleatoria significa que cada elemento tiene una probabilidad diferente al ser seleccionado.
e. La inferencia es un ordenamiento sistemático de la información en cuadros y gráficas que siempre observamos en las diferentes publicaciones e informes.

15. En los tres (3) ejemplos siguientes, determinar en cada uno de ellos:

¿Cuál es la población?
¿Cuál es la muestra?
¿Cuál es la unidad?
¿Cuál es la característica?
¿Cuál es cualitativa o cuantitativa?
¿Cuál de las variables es discreta o continua?

a. Se realiza un estudio en 350 hogares de la clase media de la ciudad Bellavista para conocer el tipo de aceite o grasa usada en la cocina. Los resultados fueron: 130 hogares utilizan el ajonjolí; maíz en 90 hogares; girasol en 75 hogares; etc.


b. El laboratorio de control de calidad de una empresa realiza un test de rapidez de acción de un pesticida de jardín, en 50 plantas infestadas. Los resultados fueron observados cada hora, habiéndose obtenido algunos datos del número de plantas totalmente libres de plaga, después del los períodos de tiempo que se indican: 6 horas, 6 plantas; 7 horas, 9 plantas: 8 horas, 5 plantas; etc.

c. En un plantel de 800 niños de ambos sexos, de 5 a 12 años, se realizó un test de aceptación a 20 : niños, utilizando una escala de 10 puntos, para medir el grado de aceptación de un nuevo producto que fabrica la compañía Chocolatera la Avispa SA










Nombre: Código:
------------------------------------------------- ----------------------------
----------------------------------------- ------------------------
----------------------------------------- ------------------------