1.3 Introducción: Una primera sesión en R

Una vez que haya instalado R, habrá un ícono en el menú Inicio de Windows (con la opción de colocar un acceso directo en el Escritorio) o en la carpeta Aplicaciones de Mac (con la opción de mantener un ícono en el Dock del área de trabajo). Al hacer clic o hacer doble clic en el icono se iniciará R. La figura 1.2 muestra la ventana asociada con la versión Mac del software. Notará que R tiene algunas opciones de botones en la parte superior de la ventana. Dentro de Mac, la barra de menú en la parte superior del espacio de trabajo también incluirá algunos menús desplegables. En Windows, los menús desplegables también se presentarán dentro de la ventana R. Sin embargo, con solo un puñado de menús y botones, los comandos en R se ingresan principalmente a través del código de usuario. Los usuarios que deseen la opción alternativa de tener más menús y botones disponibles pueden desear instalar RStudio o un programa similar que agregue una interfaz de apuntar y hacer clic a R, pero el conocimiento de la sintaxis es esencial. La Figura 1.3 muestra la ventana asociada con la versión Mac de RStudio².

Los usuarios pueden enviar su código a través de archivos de script (la opción recomendada, descrita en la Sección 1.3) o en la línea de comando que se muestra en la parte inferior de la consola R. En la Fig. 1.2, el indicador se ve así:

Fig. 1.2 R Console para una nueva sesión

Siempre que escriba código directamente en el símbolo del sistema, si un usuario escribe un solo comando que abarca varias líneas, el símbolo del sistema se convierte en un signo más (+) para indicar que el comando no está completo. El signo más no indica ningún problema o error, solo le recuerda al usuario que el comando anterior aún no está completo. El cursor se coloca automáticamente allí para que el usuario pueda ingresar comandos.

En la edición electrónica de este libro, la sintaxis de entrada y las impresiones de salida de R estarán codificadas por colores para ayudar a distinguir lo que el usuario debe escribir en un archivo de secuencia de comandos de los resultados esperados. El código de entrada se escribirá en fuente de teletipo azul. La salida R se escribirá en fuente de teletipo negro. Los mensajes de error que devuelva R se escribirán en fuente de teletipo rojo. Estos colores corresponden a la codificación de colores que utiliza R para el texto de entrada y salida. Si bien es posible que los colores no sean visibles en la edición impresa, el texto del libro también distinguirá las entradas de las salidas. Además, los nombres de las variables se escribirán en negrita. Las palabras clave conceptuales de estadística y programación, así como el texto enfatizado, se escribirán en cursiva. Finalmente, cuando el significado de un comando no sea evidente, las iniciales identificativas estarán subrayadas y en negrita en el texto. Por ejemplo, el comando lm significa linear model.

Fig. 1.3 Ventana abierta desde una sesión de RStudio

Al escribir la sintaxis R en la línea de comando o en un archivo de script, los usuarios deben tener en cuenta algunos preliminares importantes:

Las expresiones y comandos en R distinguen entre mayúsculas y minúsculas. Por ejemplo, la función var devuelve la varianza de una variable: una función simple discutida en el Capítulo 4. Por el contrario, el comando VAR de la biblioteca vars estima un modelo de autorregresión vectorial, una técnica avanzada que se analiza en el capítulo 9. De manera similar, si un nombre de usuario es un conjunto de datos mydata, entonces no se puede llamar con los nombres MyData, MyData, MYDATA o myData. R supondría que cada uno de estos nombres indica un significado diferente.
Las líneas de comando no necesitan estar separadas por ningún carácter especial como un punto y coma como en Limdep, SAS o Gauss. Una simple devolución dura servirá.
R ignora todo lo que sigue al carácter de almohadilla (#) como comentario. Esto se aplica cuando se utiliza la línea de comandos o archivos de secuencia de comandos, pero es especialmente útil al guardar notas en archivos de secuencia de comandos para su uso posterior.
El nombre de un objeto debe comenzar con un carácter alfabético, pero puede contener caracteres numéricos a partir de entonces. Un punto también puede formar parte del nombre de un objeto. Por ejemplo, x.1 es un nombre válido para un objeto en R.
Puede utilizar las teclas de flecha del teclado para desplazarse hacia atrás a los comandos anteriores. Una pulsación de la flecha hacia arriba recupera el comando introducido anteriormente y lo coloca en la línea de comandos. Cada pulsación adicional de la flecha se mueve a un comando anterior al que aparece en la línea de comando, mientras que la flecha hacia abajo llama al comando que sigue al que aparece en la línea de comando.

Aparte de este puñado de reglas importantes, el símbolo del sistema en R tiende a comportarse de una manera intuitiva, devolviendo respuestas a los comandos de entrada que podrían adivinarse fácilmente. Por ejemplo, en su nivel más básico, R funciona como una calculadora de gama alta. Algunos de los comandos aritméticos clave son: suma (+), resta (-), multiplicación ( *), división (/), exponenciación (^), la función módulo (%%) y división entera (% / %). Los paréntesis ( ) especifican el orden de las operaciones. Por ejemplo, si escribimos la siguiente entrada:

(3+5/78)^3*7

Luego, R imprime la siguiente salida:

[1] 201.3761

Como otro ejemplo, podríamos preguntarle a R cuál es el resto al dividir 89 entre 13 usando la función módulo:

89%%13

Entonces R proporciona la siguiente respuesta:

[1] 11

Si quisiéramos que R realizara una división de enteros, podríamos escribir:

89%/%13

Nuestra respuesta de salida a esto es:

[1] 6

El comando de opciones permite al usuario modificar los atributos de la salida. Por ejemplo, el argumento de dígitos ofrece la opción de ajustar cuántos dígitos se muestran. Esto es útil, por ejemplo, cuando se considera la precisión con la que desea presentar los resultados que sean razonables. Otras infunciones construidas útiles de una álgebra y una trigonometría incluyen: sin(x), cos(x), tan(x), exp(x), log(x), sqrt(x) y pi. Para aplicar algunas de estas funciones, primero podemos expandir el número de dígitos impresos y luego pedir el valor de la constante \(\pi\):

options(digits=16)
pi

En consecuencia, R imprime el valor de \(\pi\) hasta 16 dígitos:

[1] 3,141592653589793

También podemos usar comandos como pi para insertar el valor de dicha constante en una función. Por ejemplo, si quisiéramos calcular el seno de un ángulo \(\frac{\pi}{2}\) en radianes (o 90°), podríamos escribir:

sin(pi/2)

R imprime correctamente \(\sin \left(\frac{\pi}{2}\right)=1\):

[1] 1

RStudio está disponible en http://www.rstudio.com.↩︎