Интернет существует уже некоторое время, и вместе с ним в индустрии компьютерных наук произошло много изменений. Одним из самых больших сдвигов во взглядах, возникших в последнее время, стало возросшее значение вычислений и визуализаций наборов больших данных, что привело к росту числа ученых, занимающихся данными, в районе залива Сан-Франциско и в других местах, где существуют крупные технологические компании. В некотором смысле эта новая тенденция в отрасли имеет много общего с зарождением компьютерных наук, поскольку в ней широко использовались математика и статистика, а не искусство. Поскольку вычисления настолько важны, можно многое узнать из того, как математики и статистики обрабатывали наборы данных в последние десятилетия. Одним из наиболее широко используемых инструментов в этой области является R, и каждый в отрасли должен иметь некоторые практические знания о нем, потому что в ближайшие годы он станет более популярным. В этой статье мы рассмотрим, как R используется статистиками для построения примера набора данных.

# Programmer: Roberto Carlos Baldizon Diaz
# Ploting and Comparing:
x=seq(-4,4,0.01);                     # Grid of points on x-axis
yd=dnorm(x);                          # Standard Normal pdf
yp=pnorm(x);                          # Standard Normal cdf
 
plot(x,yd,type="l");                  # Plot pdf
plot(x,yp,type="l");                  # Plot cdf
plot(x,yd,type="l"); 
lines(x,yp,type="l");                 # Superimpose two plots
 
plot(x,dnorm(x,0,0.5),type="l",col="blue"); 
lines(x,dnorm(x),type="l", col="red"); 
lines(x,dnorm(x,0,2),type="l",col="black");   
# Superimpose 3 pdfs
# Making and Shading
plot(x, dnorm(x), type="l"); 
     
lines(qnorm(0.9),dnorm(qnorm(0.9)), type="h", col="red");  
# pdf with 90th percentile
plot(x, pnorm(x), type="l");
      
lines(qnorm(0.9),pnorm(qnorm(0.9)), type="h", col="red");  
# cdf with 90th percentile
x1=seq(qnorm(0.9),4,0.01);
      
y1=dnorm(x1);
      
plot(x,dnorm(x),type="l");
      
lines(x1,y1,type="h",col="red");                          
# Shade right 90th perc.

Как мы видели здесь, R — это простой и мощный язык для построения графиков и вычислений, поэтому следует ожидать, что его популярность будет только расти. Это также проект с открытым исходным кодом, поэтому для всех не должно быть проблемой приобрести его копию для личного использования и практики дома, поэтому мы все должны хотя бы ознакомиться с ним!

Пожалуйста, обращайтесь с любыми отзывами или сомнениями по поводу этой статьи, спасибо.

~ Роберто Балдизон