Thursday, December 3, 2015

5.2 Software Estadistico

¿Que es un software estadistico?

El paquete SAS (Statistical Analysis System) es un sistema de programas para el análisis de datos. Consiste de un conjunto de módulos capaces de entregar resultados de diferentes procesos como regresión, análisis de varianza, estadística básica, distribución de frecuencias, procedimientos multivariados y muchos mas.

Durante los últimos años la estadística aplicada ha ganado mucha importancia en el mundo de la investigación, probablemente debido a la gran potencia de cálculo de los ordenadores y en concreto a los diferentes paquetes estadísticos. Paralelamente, los paquetes estadísticos también se han adaptado a las nuevas necesidades, de manera que ahora ya no se habla de "paquetes estadísticos", término demasiado concreto. Por ejemplo, SAS ® inicialmente significaba "Statistical Analysis System", pero a medida que este programa iba incorporando nuevas capacidades la mayoría de las cuales no eran propiamente estadísticas, SAS ® pasó a convertirse en una sola palabra. Actualmente, los diferentes módulos de SAS ® hacen que éste sea un software de los que se llaman como "de inicio a fin". Permite crear gráficos, trabajar como una hoja de cálculo, compilar programas en lenguaje C, incluye herramientas para construir interfases para la WWW, herramientas para tratar el Datawarehouse o para explotar datos con la filosofía del Datamining, etc.

INICIO DE LA SESIÓN. 




El programa SAS ® básicamente es encuentra dividido en dos grandes ventanas: 
- Ventana izquierda "Explorer": contiene accesos directos a los ficheros que interesen, información sobre las librerías (ver capítulo 6) y una ventana de resultados dónde aparece la información obtenida de las diferentes ejecuciones desglosadas.
- Ventana derecha: Contiene las ventanas principales LOG, OUTPUT, EDITOR.
El modo de trabajo que utiliza SAS ® se basa en éstas tres ventanas: 
- Ventana EDITOR: Esta ventana corresponde a la ventana de sintaxis, por lo tanto es editable. Para poder ejecutar la sintaxis, se debe pulsar el botón: . Para ejecutar una parte de la sintaxis, primero se selecciona dicha parte y después se pulsa el botón. 
- Ventana LOG: En esta ventana se consulta y revisa todo lo que se ha ejecutado, aparecen mensajes de advertencia y de error en caso necesario y se informa sobre la velocidad de ejecución y recursos.
 - Ventana OUTPUT: Cuando se ejecutan procedimientos de SAS, en esta ventana se muestran los listados, tablas y/o resultados. 

Ventanas de diálogo desplegables: SAS ® es un programa adaptado para trabajar bajo Windows, de forma que la mayoría de ventanas desplegables tienen básicamente las mismas opciones que en cualquier otro programa para Windows: 
FILE : abrir, guardar, imprimir,...
 EDIT : deshacer, copiar, pegar, borrar, buscar, reemplazar, ...
 TOOLS: table editor (permite explorar bases de datos en formato SAS ®). 
RUN: run (ejecutar), recall (pega la sintaxis de la última ejecución en la ventana de sintaxis). SOLUTIONS: Analysis -> Analyst (aparece una ventana interactiva para el análisis de datos). WINDOW: permite cambiar de ventana (Log, Output, Editor,...). 
HELP : SAS ® SYSTEM HELP (ayuda de SAS ®), Books and training -> SAS ® Online Doc (Manual completo pero muy extenso de SAS ®).

 MÓDULOS DE SAS SAS/ACCESS Interfase a otros formatos de ficheros 
SAS/AF Lenguaje para el diseño de aplicaciones 
SAS SAS/ASSIST Asistencia para el uso de 
SAS SAS/CONNECT Conjunto de herramientas cliente/servidor
SAS/EIS Permite construir Bases de datos multidimensionales (MDDB) y relacionales (RDBMS) SAS/ETS Análisis de Series Temporales 
SAS/FSP Facilidades para la entrada de datos de forma interactiva 
SAS/GIS GIS (Sistema de Información Geográfica) interactivo con 
SAS SAS/GRAPH Módulo gráfico 
SAS/IML Manipulación de matrices 
SAS/INSIGHT Herramienta para explorar y analizar datos
SAS/MDDB Trabajo con Bases de datos Multidimensionales 
SAS/ODBC Conexiones ODBC SAS/OR Para resolver problemas de optimización 
SAS/QC Control de Calidad 
SAS/SPECTRAVIEW Visualización de datos cómo representaciones gráficas 
SAS/STAT Análisis Estadísticos 
SAS/IntrNet Permite a los usuarios ejecutar programas des de un navegador 

Otros Productos SAS 
SAS Enterprise Miner DataMining 
SAS Enterprise Guide Facilidad para el análisis estadístico




SPSS




     







SPSS es un programa estadístico informático muy usado en las ciencias sociales y las empresas de investigación de mercado. Originalmente SPSS fue creado como el acrónimo de Statistical Package for the Social Sciences aunque también se ha referido como "Statistical Product and Service Solutions". Sin embargo, en la actualidad la parte SPSS del nombre completo del software (IBM SPSS) no es acrónimo de nada.
Es uno de los programas estadísticos más conocidos teniendo en cuenta su capacidad para trabajar con grandes bases de datos y un sencillo interface para la mayoría de los análisis. En la versión 12 de SPSS se podían realizar análisis con 2 millones de registros y 250.000 variables. El programa consiste en un módulo base y módulos anexos que se han ido actualizando constantemente con nuevos procedimientos estadísticos. Cada uno de estos módulos se compra por separado.
Por ejemplo SPSS puede ser utilizado para evaluar cuestiones educativas.
Actualmente, compite no sólo con softwares licenciados como lo son SAS, MATLAB, Statistica, Stata, sino también con software de código abierto y libre, de los cuales el más destacado es el Lenguaje R. Recientemente ha sido desarrollado un paquete libre llamado PSPP, con una interfaz llamada PSPPire que ha sido compilada para diversos sistemas operativos como Linux, además de versiones para Windows y OS X. Este último paquete pretende ser un clon de código abierto que emule todas las posibilidades del SPSS.

Historia


Fue creado en 1968 por Norman H. Nie, C. Hadlai (Tex) Hull y Dale H. Bent. Entre 1969 y 1975 la Universidad de Chicago por medio de su National Opinion Research Centerestuvo a cargo del desarrollo, distribución y venta del programa. A partir de 1975 corresponde a SPSS Inc.
Originalmente el programa fue creado para grandes computadores. En 1970 se publica el primer manual de usuario del SPSS por Nie y Hall. Este manual populariza el programa entre las instituciones de educación superior en EE. UU. En 1984 sale la primera versión para computadores personales.
Desde la versión 14, pero más específicamente desde la versión 15 se ha implantado la posibilidad de hacer uso de las librerías de objetos del SPSS desde diversos lenguajes de programación. Aunque principalmente se ha implementado para Python, también existe la posibilidad de trabajar desde Visual Basic, C++ y otros lenguajes.
El 28 de junio de 2009 se anuncia que IBM, meses después de ver frustrado su intento de compra de Sun Microsystems, adquiere SPSS, por 1.200 millones de dólares.


Modulos del spss

El sistema de módulos de SPSS, como los de otros programas (similar al de algunos lenguajes de programación) provee toda una serie de capacidades adicionales a las existentes en el sistema base. Algunos de los módulos disponibles son:
  • Modelos de Regresión
  • Modelos Avanzados
    • Reducción de datos: Permite crear variables sintéticas a partir de variables colineales por medio del Análisis Factorial.
    • Clasificación: Permite realizar agrupaciones de observaciones o de variables (cluster analysis) mediante tres algoritmos distintos.
    • Pruebas no paramétricas: Permite realizar distintas pruebas estadísticas especializadas en distribuciones no normales.
  • Tablas: Permite al usuario dar un formato especial a las salidas de los datos para su uso posterior. Existe una cierta tendencia dentro de los usuarios y de los desarrolladores del software por dejar de lado el sistema original de TABLES para hacer uso más extensivo de las llamadas CUSTOM TABLES.
  • Tendencias
  • Categorías: Permite realizar análisis multivariados de variables normalmente categorías. También se pueden usar variables métricas siempre que se realice el proceso de recodificación adecuado de las mismas.
  • Análisis Conjunto: Permite realizar el análisis de datos recogidos para este tipo específico de pruebas estadísticas.
  • Mapas: Permite la representación geográfica de la información contenida en un fichero (descontinuado para SPSS 16).
  • Pruebas Exactas: permite realizar pruebas estadísticas en muestras pequeñas.
  • Análisis de Valores Perdidos: Regresión simple basada en imputaciones sobre los valores ausentes.
  • Muestras Complejas: permite trabajar para la creación de muestras estratificadas, por conglomerados u otros tipos de muestras.
  • SamplePower (cálculo de tamaños muestrales)
  • Árboles de Clasificación: Permite formular árboles de clasificación y/o decisión con lo cual se puede identificar la conformación de grupos y predecir la conducta de sus miembros.
  • Validación de Datos: Permite al usuario realizar revisiones lógicas de la información contenida en un fichero ".sav" y obtener reportes de los valores considerados atípicos. Es similar al uso de sintaxis o scripts para realizar revisiones de los ficheros. De la misma forma que estos mecanismos es posterior a la digitalización de los datos.
  • SPSS Programmability Extension (SPSS 14 en adelante). Permite utilizar el lenguaje de programación Python para un mejor control de diversos procesos dentro del programa que hasta ahora eran realizados principalmente mediante scripts (con el lenguaje SAX Basic). Existe también la posibilidad de usar las tecnologías .NET de Microsoft para hacer uso de las librerías del SPSS. Aunque algunos usuarios han cuestionado sobre la necesidad de incluir otros lenguajes, la empresa no tiene esto entre sus objetivos inmediatos.
Desde el SPSS/PC hay una versión adjunta denomina SPSS Student que es un programa completo de la versión correspondiente pero limitada en su capacidad en cuanto al número de registros y variables que puede procesar. Esta versión es para fines de enseñanza del manejo del programa

No comments:

Post a Comment