Интернет существует уже некоторое время, и вместе с ним в индустрии компьютерных наук произошло много изменений. Одним из самых больших сдвигов во взглядах, возникших в последнее время, стало возросшее значение вычислений и визуализаций наборов больших данных, что привело к росту числа ученых, занимающихся данными, в районе залива Сан-Франциско и в других местах, где существуют крупные технологические компании. В некотором смысле эта новая тенденция в отрасли имеет много общего с зарождением компьютерных наук, поскольку в ней широко использовались математика и статистика, а не искусство. Поскольку вычисления настолько важны, можно многое узнать из того, как математики и статистики обрабатывали наборы данных в последние десятилетия. Одним из наиболее широко используемых инструментов в этой области является R, и каждый в отрасли должен иметь некоторые практические знания о нем, потому что в ближайшие годы он станет более популярным. В этой статье мы рассмотрим, как R используется статистиками для построения примера набора данных.
# Programmer: Roberto Carlos Baldizon Diaz # Ploting and Comparing: x=seq(-4,4,0.01); # Grid of points on x-axis yd=dnorm(x); # Standard Normal pdf yp=pnorm(x); # Standard Normal cdf plot(x,yd,type="l"); # Plot pdf plot(x,yp,type="l"); # Plot cdf plot(x,yd,type="l"); lines(x,yp,type="l"); # Superimpose two plots plot(x,dnorm(x,0,0.5),type="l",col="blue"); lines(x,dnorm(x),type="l", col="red"); lines(x,dnorm(x,0,2),type="l",col="black"); # Superimpose 3 pdfs # Making and Shading plot(x, dnorm(x), type="l"); lines(qnorm(0.9),dnorm(qnorm(0.9)), type="h", col="red"); # pdf with 90th percentile plot(x, pnorm(x), type="l"); lines(qnorm(0.9),pnorm(qnorm(0.9)), type="h", col="red"); # cdf with 90th percentile x1=seq(qnorm(0.9),4,0.01); y1=dnorm(x1); plot(x,dnorm(x),type="l"); lines(x1,y1,type="h",col="red"); # Shade right 90th perc.
Как мы видели здесь, R — это простой и мощный язык для построения графиков и вычислений, поэтому следует ожидать, что его популярность будет только расти. Это также проект с открытым исходным кодом, поэтому для всех не должно быть проблемой приобрести его копию для личного использования и практики дома, поэтому мы все должны хотя бы ознакомиться с ним!
Пожалуйста, обращайтесь с любыми отзывами или сомнениями по поводу этой статьи, спасибо.
~ Роберто Балдизон