Profesores: Kevin Carrasco y Daniela Olivares Ayudante: María Fernanda Núñez
Primera distinción:R y RStudio
R es un lenguaje de programación que permite la manipulación, almacenaje, cálculo y visualización de datos.
RStudio es el ambiente que nos permite visulizar de forma más amigable R. Contiene 4 espacios
4 cuadrantes de RStudio:
Editor de sintaxis : entorno donde se despliega la hoja de códigos (generalmente un R Script) que se utlizará para procesar la base de datos
Consola: visualizador de resultados de los códigos desplegados en la sintaxis
4 cuadrantes de RStudio:
Entorno de trabajo: espacio donde se alojan la base de datos, los objetos, las tablas, etc. que vamos creando en nuestra sesión de trabajo
Espacio de archivos/carpetas, gráficos, paquetes y ayuda
Flujo de trabajo:IPO
Crear un proyecto
Abrir RStudio
Hacer click en el siguiente simbólo que aparece en el esquina superior derecha:
Seleccionar “New Project”
Seleccionar “New directory”
Definir un nombre al proyecto
Definir ubicación del proyecto con la opción “Browse”
Crear un script (o documento de R)
Un R Script es una hoja de código donde se escriben las instrucciones y los códigos para el tratamiento de datos. Para crear un R Script hay dos formas:
En la esquina superior izquierda hay un icono de una hoja con un signo “+” verde, hay que clikearlo y seleccionar R Script.
con las teclas Ctrl+Shift+N
Para guardarlo, hay que (a) hacer click en el signo de documento en la parte superior del Script, o (b) con las teclas Crtl + S
Lenguaje de R: nociones básicas de código
R como calculadora
Para sumar:
1+2
[1] 3
R como calculadora
Para sumar:
1+2
[1] 3
Para restar:
3-1
[1] 2
R como calculadora
Para sumar:
1+2
[1] 3
Para restar:
3-1
[1] 2
Para multiplicar:
3*5
[1] 15
R como calculadora
Para sumar:
1+2
[1] 3
Para restar:
3-1
[1] 2
Para multiplicar:
3*5
[1] 15
Para dividir:
4/2
[1] 2
R como calculadora
Para sumar:
1+2
[1] 3
Para restar:
3-1
[1] 2
Para multiplicar:
3*5
[1] 15
Para dividir:
4/2
[1] 2
Para elevar al cuadrado:
2^2
[1] 4
Objetos/vectores/variables
Se trata de: asignar un valor a un objeto o asignar a un objeto un valor, donde < - es nuestro “asignador” que nos sirve para crear objetos
Se pueden asignar números o nombres
x <-2#asignamos el valorx #ejecutamos
[1] 2
y <-"hola"y
[1] "hola"
Variable (conjunto de datos)
Podemos crear un vector, conjunto de datos o una variable con el siguiente comando:
genero <-c(1,1,2,1,2,2,2,1,2)
Donde: masculino=1; femenino =2
Tipos de datos
Character: valores alfanuméricos, es decir, letras, números y signos mezclados.
a <-"totalmente de acuerdo"a
[1] "totalmente de acuerdo"
class(a) #para observar la clase (o tipo de vector) del objeto
[1] "character"
Tipos de datos
Numeric: valores numéricos, incluye decimales.
b <-1b
[1] 1
class(b)
[1] "numeric"
Tipos de datos
logical: valores lógicos, TRUE (T) o FALSE (F).
i <-FALSEi
[1] FALSE
class(i)
[1] "logical"
Data Frame (o base de datos)
Un data frame es una base de datos que contiene dos dimensiones (columnas y filas) donde podemos agrupar variables
Siguiendo con el caso anterior:
genero <-c(1,1,2,1,2,2,2,1,2)ingreso <-c(100000,300000,500000,340000,300000,500000,650000,410000,750000)acuerdo <-c(1,1,3,2,4,1,5,3,2)
OJO: todas las variables deben tener la misma cantidad de casos
names(datos_ficticios)# nos muestra los nombres de nuestras variables
[1] "genero" "ingreso" "acuerdo"
dim(datos_ficticios) #nos muestra la cantidad de casos (9) y de variables (3)
[1] 9 3
Códigos básicos para el uso de R en la carrera
Librerias
Las librerias corresponden al conjunto de paquetes que utlizaremos para trabajar en nuestra sesión de R
Estas deben ser siempre cargadas antes de comenzar a trabajar en nuestra hoja de códigos. En cada sesión de trabajo
Sin embargo, esta deben ser instaladas solo una vez
Para instalar librerías se utiliza el siguiente código:
install.packages(“paquete_a_utilizar”)
Para cargar librerias se utiliza el siguiente código:
library (paquete_A_utilizar)
Paquetes
Los paquetes corresponden al conjunto de funciones específicas que usaremos en nuestra sesión de R.
Los principales son dos:
pacman: este facilita y agiliza la lectura de los paquetes a utilizar en R
tidyverse: es nuestro entorno de trabajo o colección de paquetes que utlizaremos para el procesamiento de nuestros datos, de los cuales destacan los paquetes dplyr y haven
Paquetes:tidyverse
dplyr: nos permite seleccionar variables de un set de datos
Paquetes:tidyverse
dplyr: nos permite seleccionar variables de un set de datos
haven: cargar y exportar bases de datos en formatos .sav y .dta
Paquetes:tidyverse
dplyr: nos permite seleccionar variables de un set de datos
haven: cargar y exportar bases de datos en formatos .sav y .dta
car: para recodificar/agrupar valores de variables
Paquetes:tidyverse
dplyr: nos permite seleccionar variables de un set de datos
haven: cargar y exportar bases de datos en formatos .sav y .dta
car: para recodificar/agrupar valores de variables
Importar base de datos
A continuación se presentan funciones para importar diferentes formatos de base de datos: