Saltar al contenido

R

Cuando pensamos en un lenguaje de programación, nos viene a la mente un programador que crea páginas web, aplicaciones móviles o un programa de escritorio.

Pero existen otros lenguajes que se utilizan en otros campos, ya sea especializado, por ejemplo, en el área de las matemáticas (como puede ser MATLAB) o en el big data (el análisis de un gran volumen de datos).

Sabemos que Python se suele utilizar para crear scripts y análisis de big data, pero hoy hablaremos del lenguaje de programación R.

Índice del contenido

¿Qué es el Big Data?

Antes de hablar del lenguaje R, vamos a detallar un poco más a que nos referimos con Big Data.

Con el Big Data hablamos como su nombre indica de un gran volumen de datos o datos masivos. Estos datos pueden estar en cualquier formato, ya sea una base de datos relacional, estructurado o desordenado.

No estamos hablando de gigas de informacion, sino de Terabytes o incluso de varios Petabytes. Cuando estamos hablando de esa cantidad de datos, tenemos varios inconvenientes para procesar la información:

  • su gran tamaño (y su crecimiento).
  • la complejidad de los datos.
  • el almacenamiento.
  • la velocidad en el tratamiento.

Ejemplos de datos de estos tamaños serían:

  • las bases de datos de grandes compañías de internet, por ejemplo Google o Facebook. Se calcula que Youtube crece en 300 horas de vídeo, ¡cada minuto!
  • Datos utilizados a nivel gubernamental, como puede ser el Insituto Nacional de Estadística de España, que trata desde el índice de precios hasta el padrón.
  • Datos bancarios, sobretodo su histórico.

¿Que hacemos con toda esa información? Pues esa información se trata y se analiza para diferentes objetivos. Por eso es posible que hayas oído hablar de la minería de datos.

La minería de datos explora ese big data, en busca de patrones para extraer esa información y analizarla.

¿Y como se hace eso?

Está claro que la estadística es perfecta para poder analizar esos datos. Existen programas especializados en estadística, como puede ser SPSS o Statistica, con su propio lenguaje de programación para poder tratar mejor esos datos.

Ahora veremos porque el lenguaje de programación R es uno de los más usados.

Características del lenguaje de programación R

El Lenguaje R se creó en 1993, en la universidad de Auckland. Viene derivado de otros dos lenguajes, que son S y Scheme. Sus creadores son Ross Ihaka y Robert Gentleman.

Lenguaje r estadistica

R es un lenguaje con licencia GNU, es decir, es libre, gratuito y abierto. En resumen, lo puede usar cualquiera y no es propiedad de nadie.

R funciona con paquetes gratuitos, como las librerias en otros lenguajes, y puedes descargar y usar esos paquetes. Todo esto está en la web The Comprehensive R Archive Network.

Algunas de sus características principales como lenguaje son:

  • Posibilidad  de crear gráficos, basado en LaTeX.
  • Gran cantidad de herramientas estadísticas:
    • modelos lineales y no lineales.
    • Tests estadísticos.
    • algoritmos de clasificación y agrupamiento.
  • Posibilidad de crear tus propias funciones, además de objetos al ser su programación POO (orientada a objetos).
  • Integración con distintas bases de datos.
  • Puede tener un uso matemático, como sustitución a MATLAB.

¿Qué es R Studio?

¿Qué diferencia entre R y R Studio? R es el lenguaje de programación, y R Studio es un IDE.

Como hemos dicho en otras ocasiones, un Entorno de Desarrollo Integrado (IDE) proporciona todas las herramientas necesarias para poder programar en el lenguaje R.

Al instalar R Studio, puedes programar en R directamente en una consola, muy parecida al Símbolo del Sistema de Windows.

lenguaje de programacion R consola

Con R Studio tienes muchas más opciones, como la posibilidad de crear gráficos. R Studio también es gratuito, así que es la mejor opción para poder escribir en este lenguaje.

r studio ide lenguaje programacion

¿Qué es R Commander?

Aunque hemos hablado de R Studio, debemos también mencionar a R Commander.

Si te asusta programar, o quieres usar R y no tienes conocimientos, con R Commander puedes usar la mayoría de análisis estadísticos más comunes.

Se puede instalar R Commander desde el propio R Studio, como un paquete más, y utilizar la gran cantidad de opciones de menú para poder programar lo que más nos interesa.

r commander lenguaje de programacion

Curso de programación R

Actualmente puedes aprender el lenguaje R de muchas manera posibles, además que es fácil encontrar información en español.

Ajustes