preloader

Pruebas estadísticas en R

1 de enero de 2019 | 7 minutos de lectura
Índice de contenido

Resumen:
En este tutorial aprenderá cómo añadir una leyenda en R y cómo personalizarla.
¿Cómo citar el presente artículo?
Romero, J. (Enero 1, 2019). Añadir leyendas a un gráfico en R. R.JeshuaRomeroGuadarrama. https://www.r.jeshuaromeroguadarrama.com/es/blog/r/graficos/leyendas/.
Añadir leyendas a un gráfico en R by Jeshua Romero Guadarrama, available under Attribution 4.0 International (CC BY 4.0) at https://www.r.jeshuaromeroguadarrama.com/es/blog/r/graficos/leyendas/.

Pruebas estadísticas en R

En numerosas ocasiones, investigadores en una amplia variedad de áreas temáticas, se han preguntado ¿cómo realizo una determinada prueba estadística?

La respuesta a menudo implicaba fórmulas de programación complicadas en hojas de cálculo y buscar pruebas estadísticas en tabulaciones de distribuciones de probabilidad.

No obstante, con la llegada de R, las pruebas estadísticas ahora son más fáciles que nunca. El presente artículo está diseñado para darle acceso rápido a las pruebas estadísticas más populares.

Muestro, paso a paso, cómo realizar estas pruebas en el paquete estadístico gratuito y popular R. A partir de lo cual, mi objetivo es dar:

  • Amplitud en lugar de profundidad (ser una guía, no un libro de cocina).
  • Palabras en lugar de matemáticas (pocas ecuaciones).
  • Ilustraciones y ejemplos en lugar de recetas y fórmulas.

¿Para quién están dirigidas?


La presente serie surgió del deseo de poner herramientas estadísticas en manos de todo tipo de profesionales.

Por lo tanto, el material está diseñado para ser utilizado por el investigador aplicado cuyo enfoque principal se encuentra en sus tema de investigación en lugar de lemas matemáticos o teoría estadística.

Los ejemplos de cada prueba se describen claramente y se pueden escribir directamente en R como se han mostrado.

Para acelerar los procesos de investigación, se incluyen más de trescientas aplicaciones publicadas de pruebas estadísticas en ingeniería, ciencia y ciencias sociales.

Dichas aplicaciones ilustrativas cubren una amplia gama de disciplinas que incorporan numerosos temas, tales como:

  • El análisis angular de las raíces de los árboles.
  • El síndrome de Angelman.
  • La lactancia materna en hospitales infantiles.
  • La comparación de intervenciones cardiovasculares.
  • La informática en mayores de 50 años.
  • La comunicación entre perros y humanos.
  • Los efectos del t’ai chi en balance.
  • El análisis forense ambiental.
  • La aleatoriedad del universo.
  • El discurso emocional.
  • La orientación solar de los saltamontes.
  • El concepto de personas de los caballos.
  • El trasplante de células madre hematopoyéticas.
  • El pie zambo idiopático en Suecia.
  • El uso prudente del esperma.
  • La gimnasia artística masculina.
  • Los defectos de software.
  • Las cronologías de láminas de estalagmita.
  • El conflicto sexual en insectos.
  • Los precios de la vivienda en el sur de Londres.
  • Entre mucho otros.

Las referencias completas se dan al final de cada prueba.

De acuerdo con el espíritu de la época de R, las copias de todos los documentos discutidos están disponibles de forma gratuita.

¿Nuevo en R?


Los nuevos usuarios de R pueden usar los comandos fácilmente y sin ningún conocimiento previo. Esto se logra mejor escribiendo los ejemplos tal como se dan y leer los comentarios que siguen al resultado de una prueba.

Se pueden descargar copias de R y guías tutoriales gratuitas para principiantes en http://www.rproject.org/.

Hay al menos cinco formas de usar la serie para aumentar su productividad.

Primero, puede sumergirse en ella como una herramienta de referencia eficiente. Vaya a la prueba que necesita y vea rápidamente cómo calcularla en R.

En este sentido, para obtener los mejores resultados, escriba el ejemplo que se proporciona, examine los resultados y luego ajuste el ejemplo a sus propios datos.

En segundo lugar, explore las trescientas aplicaciones e ilustraciones para ayudar a estimular sus propias ideas de investigación.

En tercer lugar, es posible que ya haya recopilado datos y tenga una pregunta en mente como “¿es útil esta serie temporal para pronosticar otra serie temporal?”.

Así pues, busque una prueba estadística adecuada dada su pregunta de investigación.

En cuarto lugar, al escribir los numerosos ejemplos, fortalecerá su conocimiento y comprensión tanto de las pruebas estadísticas como de R.

Finalmente, utilice la clasificación de pruebas que se proporciona a continuación para determinar qué tipos de pruebas son las más adecuadas para sus datos:

  • Número de las pruebas para correlación y causalidad: \(1,2,3,4,5,6,7,8,9,10,11\)
  • Número de las pruebas para pruebas de una muestra para la media y la mediana: \(12,13,14\)
  • Número de las pruebas para pruebas de dos muestras para la media y la mediana: \(15,16,17,18,19,20,21,22,23,24\)
  • Número de las pruebas para aleatoriedad e independencia: \(25,26,27,28,29,30,31\)
  • Número de las pruebas para diferencia en los parámetros de escala: 32,35
  • Número de las pruebas para homogeneidad de varianzas: \(33,34,35,36,37,38,39,40,41\)
  • Número de las pruebas para tasas y proporciones: \(2,43,44,45,46,47,48\)
  • Número de las pruebas para datos de conteo: $ 49,50,51,52 $
  • Número de las pruebas para tendencia central para tres o más muestras: \(53,54,55,56,57,57,59,60\)
  • Número de las pruebas para normalidad de muestra: \(61,62,63,64,65,66,67,68,69\)
  • Número de las pruebas para diferencias de distribución: \(70,71,72,73\)
  • Número de las pruebas para igualdad estocástica: \(74\)
  • Número de las pruebas para valores atípicos de muestra: \(39,69,75,76,77,78\)
  • Número de las pruebas para heterocedasticidad: \(79,80,81\)
  • Número de las pruebas para linealidad: \(82,83,84\)
  • Número de las pruebas para raíces unitarias: \(85,86,87,88,89,90,91\)
  • Número de las pruebas para análisis de supervivencia: $ 92,93, 94 $
  • Número de las pruebas para datos circulares: \(95,96,97,98,99,100\)

Cada artículo de la serie comienza con la pregunta que aborda la prueba estadística. A esto le sigue una breve guía que explica cuándo usar la prueba.

Luego, se discuten tres aplicaciones en la literatura publicada y se ilustra un ejemplo de la prueba usando R.

Sigo la convención en la comunidad R de dar la función utilizada para la prueba estadística, seguida entre llaves por el paquete de R requerido para usar la función.

Por ejemplo, Prueba.Correlación{fbasics} se refiere a la función Prueba.Correlación en el paquete fbasics.

Si un paquete mencionado en el texto no está instalado en su máquina, puede descargarlo escribiendo install.packages('nombre_paquete').

Por ejemplo, para descargar el paquete Fbasics, se debe escribir en la consola de R:

R
install.packages('fbasics')

Una vez que se instala un paquete, debe llamarlo antes de escribir el ejemplo mostrado. Para ello, se debe escribir en la consola de R:

R
require(nombre_paquete)

La alternativa es hacer uso de la función library(). Para lo cual, se debe escribir en la consola de R:

R
library(nombre_paquete)

Solo necesita escribir esto una vez (al comienzo de su sesión de R). Así pues, para llamar al paquete fbasics, se debe escribir al inicio:

R
require(fbasics)

library(fbasics)

El paquete fbasics ahora está listo para ser empleado usar.

Ejemplo práctico de una prueba estadística en R


La función resettest{lmtest} se puede utilizar para realizar la prueba RESET de Ramsey. Si el paquete Imtest no está instalado, debe escribir el siguiente código:

R
install.packages('lmtest')

Para acceder a la función resettest tendría que teclear:

R
require(lmtest)

library(lmtest)

Ahora está listo para realizar la prueba RESET de Ramsey.

¡Vamos a intentarlo ahora mismo! Introduzca los siguientes datos, recopilados, sobre tres variables:

R
dep = c(3083, 3140, 3218, 3239, 3295, 3374, 3475, 3569, 3597, 3725, 3794, 3959, 4043, 4194)
dep
Output
 [1] 3083 3140 3218 3239 3295 3374 3475 3569 3597 3725 3794 3959 4043 4194
R
ind.1 = c(75, 78, 80, 82, 84, 88, 93, 97, 99, 104, 109, 115, 120, 127)
ind.1
Output
 [1]  75  78  80  82  84  88  93  97  99 104 109 115 120 127
R
ind.2 = c(5, 8, 0, 2, 4, 8, 3, 7, 9, 10, 10, 15, 12, 12)
ind.2
Output
 [1]  5  8  0  2  4  8  3  7  9 10 10 15 12 12
Así pues, se construyen un modelo de regresión lineal simple.
R
modelo <- lm(dep ~ ind.1 + ind.2)
modelo
Output

Call:
lm(formula = dep ~ ind.1 + ind.2)

Coefficients:
(Intercept)        ind.1        ind.2  
   1488.665       21.443       -1.001  

Ahora, se usará la prueba RESET para evaluar si se deben incluir segundas o terceras potencias de las variables independientes ind.1 e ind.2. Se puede hacer esto escribiendo:

R
resettest(modelo, power = 2:3, type = "regressor")

R responderá mostrando lo siguiente:

Output

	RESET test

data:  modelo
RESET = 1.6564, df1 = 4, df2 = 7, p-value = 0.2626

A lo largo de la serie, se usará el nivel de significancia al \(5\%\) como guía para rechazar la hipótesis nula.

El punto anterior simplemente significa que si el \(p\)-value (valor de \(p\)) informado por R es inferior a \(0.05\), se rechaza la hipótesis nula.

Dado que, en este ejemplo, el \(p\)-value (valor de \(p\)) es mayor que \(5\%\) ($p$-value \(=0.2626\)), no se rechaza la hipótesis nula de linealidad.

¡Es así de simple! Vuelva a consultar este artículo para refrescar su memoria según sea necesario.

Referencias


  • Romero, G. J. (2022) Estadística avanzada con R. JeshuaNomics
comments powered by Disqus

popular post

Problemas de transporte y asignación

Resumen: Existen dos tipos de problemas especiales en la investigación de operaciones, los problemas de transporte y de asignación.

Leer más

Programación lineal

Resumen: Utilizar R para resolver problemas de programación lineal vinculados a la investigación de operaciones.

Leer más

Programación lineal entera

Resumen: Utilizar R para resolver problemas de programación lineal entera vinculados a la investigación de operaciones.

Leer más