数据科学之R语言:预定义函数及数据集的使用与变量命名原则!

2022-12-17 0 430

在表述好表达式后,统计数据挖掘的操作过程便由一连串应用领域于统计数据的表达式来顺利完成了。R包涵了许多预表述的表达式,而他们所展开的绝大多数的预测都广为采用了那些表达式。比如他们在下面所采用的:install.packages(安装包)、library(读取包)、ls(列举已表述的第一类)和用作排序解法的sqrt表达式等。

总之,除了更多的表达式也能透过package展开加进,在他们表述或初始化那些表达式时,会再次出现在workspace中。一般而言,在表达式的前面加之括弧“()”才可初始化该表达式,比如,在R console中仅输出ls是难以采用该表达式,但若,这种R会表明表述该表达式的标识符。

数据科学之R语言:预定义函数及数据集的使用与变量命名原则!

与ls相同,绝大多数的表达式须要两个或数个模块(argument),那些模块放到括弧中。比如,log表达式:在log(a)中,R或许会回到结论0,原因在于他们以后早已表述了第一类a,为其表达式1;a对log表达式而言即是其模块。

数据科学之R语言:预定义函数及数据集的使用与变量命名原则!

在R中,他们也能将表达式结论2.718,但若,若他们透过log(2.718)方可获得结论1,应用领域到冗余表达式中,他们能看如下表所示的范例:

对绝大部分的表达式而言,他们能采用下面的形式查阅协助文件格式,即在表达式中文名称眼前加之两个小标题“?”:?log

数据科学之R语言:预定义函数及数据集的使用与变量命名原则!

在上述的标识符中,R先执行的是exp表达式,再执行log表达式,即从里到外的顺序,最后回到结论1。

R提供了两个非常好用的表达式help,透过该表达式他们能查阅所要用的表达式的采用方法。help文件格式相当于两个用户手册一样,为他们提供大量的参考信息。比如:

对绝大部分的表达式而言,他们能采用下面的形式查阅协助文件格式,即在表达式中文名称眼前加之两个小标题“?”:?log

数据科学之R语言:预定义函数及数据集的使用与变量命名原则!

对绝大部分的表达式而言,他们能采用下面的形式查看协助文件格式,即在表达式中文名称眼前加之两个小标题“?”:?log

在log表达式的协助文件格式中,会告知该表达式须要哪些模块,其基本形式为log(x, base),说明一般而言log所需的模块有两个。在某些情况下或对一些表达式而言,有些模块是必要的,有些则是可选的。在文件格式说明中,表达式的默认值default value以“=”表达式时,说明该模块为可选模块。比如,log表达式的“base=exp(1)”,即为自然对数。

比如,install.packages是R已有的方法,他们则不再采用其作为某个表达式来表达式,如以下标识符:install.packages <- 2

他们也能更改默认的base值,这种的话自行为其表达式方可,如:

数据科学之R语言:预定义函数及数据集的使用与变量命名原则!

由此可知,当他们在为模块表达式时,采用的是“=”。在log表达式的协助文件格式中,他们注意到其每个模块都有各自的中文名称,第两个模块为“x”,第二个模块为“base”,但是在R console中会省去表达式的整个操作过程,而直接给出各个模块的值,中间用逗号“,”隔开方可,如果省去模块的中文名称,则须要按照他们所要的顺序输出模块的值,而如果加之模块的中文名称,则无所谓前后的顺序如何。

数据科学之R语言:预定义函数及数据集的使用与变量命名原则!

R除了有预表述的表达式供他们采用,除了一些统计数据集以便他们展开测试。当他们在console中输出以下标识符时,可查阅有哪些已创建的统计数据集:

数据科学之R语言:预定义函数及数据集的使用与变量命名原则!

选择其中两个统计数据集CO2,可查阅该统计数据集的具体统计数据:

数据科学之R语言:预定义函数及数据集的使用与变量命名原则!

在下面的解法中,他们透过表述表达式a、b、c来进行运算,实际上表达式的中文名称能是任何可识别的符号,但是为了使他们的标识符具有可读性,通常还是会有一些基本的准则:

以字母开始(start with letter);

不包涵空格(no space);

非R中已定义的表达式名。

比如,install.packages是R已有的方法,他们则不再采用其作为某个表达式来表达式,如以下标识符:install.packages <- 2

下面再举个符合以上准则的范例,在排序上述一元二次方程的解时,他们能分别以下面的表达式来重新命名:

solution_1 <- (-b + sqrt(b^2 – 4*a*c)) / (2*a)

solution_2 <- (-b – sqrt(b^2 – 4*a*c)) / (2*a)

如此一来,若他们要解决另两个解法3x+2x-1,他们只需重新表述a、b、c三个表达式的值方可:

数据科学之R语言:预定义函数及数据集的使用与变量命名原则!

关于如何使标识符更具可读性,在脚本中经常会采用到注释,即为某段标识符加之一些简单的说明,以便他们更好地了解此段标识符的作用。Comments注释以“#”开始,执行脚本时不会对那些注释展开运算。

## Compute solution to the quadratic equation of ax^2+bx+c

## Define variables

a <- 1

b <- 1

c <- -1

## Compute the solution

(-b + sqrt(b^2 – 4*a*c)) / (2*a)

(-b – sqrt(b^2 – 4*a*c)) / (2*a)

数据科学之R语言:预定义函数及数据集的使用与变量命名原则!

本期他们简单分享了在R中的表达式、统计数据集、表达式重新命名和注释的采用等知识点,更多内容欢迎继续关注后续更新!

#统计数据挖掘#

举报/反馈

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务