技术原理

2020年你必须准备的前50个面试问题

人士

这里列出了你必须准备的前50个面试问题和答案。这个博客涵盖了你在R上采访时可能会问到的所有重要问题。这些R采访问题将使你在新兴的分析市场中占据优势,在这个市场中,全球和本地的企业,无论大小,都在寻找在R方面具有认证专业知识的专业人士。

R是一种非常有用的编程语言就像你想的那样。它是一个你可以使用的工具,可以用于多种用途,如统计分析、数据可视化、数据操作、预测建模、预测分析和列表。R被Google、Facebook和Twitter等顶级公司使用。

R采访问题:1。R中有哪些不同的数据结构?简要解释一下。”广义上说,这些都是R中可用的数据结构:

数据结构R中的数据结构描述向量向量向量是一系列基本类型相同的数据元素。向量中的成员称为组件。列表是R对象,其中包含不同类型的元素,如数字、字符串、向量或其中的另一个列表。矩阵矩阵是一种二维数据结构。矩阵用于绑定相同长度的向量。矩阵的所有元素必须属于相同类型(数字、逻辑、字符、复数)。数据帧数据帧比矩阵更通用,即不同的列可以有不同的数据类型(数字、字符、逻辑等)。它结合了矩阵和列表的特性,就像一个矩形列表。2。如何在R中加载.csv文件?在R中加载.csv文件非常容易。您只需要使用“read.csv()”函数并指定文件的路径。house

marks-R Interview Questions-Edureka

我们将用一个新的数据集“Percentage”绑定它,该数据集由两列组成:->“Total”和“Percentage”

install-R Interview Questions-Edureka1”

让我们使用“cbind()”函数->

cbind(Marks,Percentage)“install-R Interview Questions-Edureka2”

组合这两个数据集中的列,因为这两个数据集中的行数相同,我们在“cbind()”函数

18的帮助下组合了这些列。给出R.

while循环中while和for循环的示例:

install-R Interview Questions-Edureka3”

for循环:

for-R Interview Questions-Edureka19。给出“dplyr”包中“select”和“filter”函数的示例

“”birth_weight_data_R Interview Questions-Edureka“”

Select:来自“dplyr”包的此函数用于从数据集

Birth\u weight%>%Select(1,2,3) ->birth

birth1_3-R Interview Questions-Edureka

birth“birth”weight%>%select(-5)->birth

birth-R Interview Questions-Edureka

筛选器:来自“dplyr”包的此函数用于根据条件筛选出某些行:

birth“weight%>%Filter(母亲年龄>35)->birth

install-R Interview Questions-Edureka8”

birth“birth”weight%>%Filter(婴儿体重>125&smoke==”smoker“)->birth

install-R Interview Questions-Edureka9”

20。stringR包的用途是什么。请给出Stringr中函数的一些示例。”

“StringR中的一些函数:

Initial:

fruit->

fruit1-R Interview Questions-Edureka

将字符串转换为大写:str_to_upper(fruit)fruit_capital-R Interview Questions-Edureka查找字母数:str_count(fruit)count_str-R Interview Questions-Edureka21。你对R里的拨浪鼓包了解多少?”

“Rattle是使用R进行数据挖掘的一个流行的图形用户界面。它提供数据的统计和可视化摘要,转换数据以便易于建模,从数据构建无监督和有监督的机器学习模型,以图形方式显示模型的性能,并为部署到生产中的新数据集评分关键的特点是你所有的互动ugh图形用户界面被捕获为一个R脚本,可以在R中很容易地执行,而不依赖于嘎嘎声界面。

22。在R中,如何在一个页面上绘制多个绘图?”

“使用基图将多个图绘制到一个页面上非常简单:

例如,如果要将4个图绘制到同一窗格上,可以使用以下命令:

par(mfrow=c(2,2))

plot-R Interview Questions-Edureka

hist-R Interview Questions-Edureka23。如何使用ggplot2包创建散点图?”

“散点图可用于同时显示两个或多个实体之间的相关性。”

让我们举一个例子,了解如何使用ggplot2包->

ggplot(iris,aes(y=Sepal.Length,x=Petal.Length)) geom_point()

scatter-R Interview Questions-Edureka24制作散点图。您将如何使用ggplot2包封装数据?”

“让我们以一个例子来理解使用ggplot2

初始值:

ggplot(house,aes(y=price,x=waterfront)) geom_boxplot()boxpot-R Interview Questions-Edurekaggplot(house,aes(y=price,x=waterfront)) geom_boxplot() facet_grid(.~ waterfront)”box_facet-R Interview Questons-Edureka“25的刻面。给定一个值向量,如何将其转换为时间序列对象?”

“假设这是我们的向量->”

“a”

“a s.ts(a)->a”time-R Interview Questions-Edureka

让我们绘制此图:

ts.plot(a)time_series-R Interview Questions-Edureka26。什么是白噪声模型,如何使用R模拟它?”“白噪声(WN)模型是一个基本的时间序列模型。它是平稳过程的最简单的例子。”白噪声模型有:

一个固定的常数平均一个固定的常数方差随着时间的推移没有相关性

模拟R中的白噪声模型:

arima.sim(model=list(order=c(0,0,0)),n=50)->wn

white_noise-R Interview Questions-Edureka

ts.plot(wn)white_noise-R Interview Questions-Edureka27。什么是随机游走模型?如何使用R模拟它?”

“随机游走是非平稳过程的一个简单例子。”

随机游走有:

没有指定的平均值或方差随时间的变化或增量是白噪声

在R中模拟随机游走:

arima.sim(model=list(order=c(0,1,0)),n=50)->rw ts.plot(rw)

Random_Walk-R Interview Questions-Edureka

28。什么是主成分分析,如何在R中创建PCA模型?”

主成分分析是一种降维方法。很多时候,恰巧一次观测与多个维度(特征)相关,这给数据带来了很多混乱,这就是为什么要减少维度的数量。

主成分分析的概念是这样的:

数据被转换到一个新的空间,尺寸相等或较少的。这些尺寸(特征)称为主要部件。第一主成分捕捉原始数据中特征的最大方差。第二主成分与第一主成分正交,并捕获剩余的最大变异量。每一个主成分也是如此,它们都是不相关的,每一个都不如前一个重要。”

“借助于”prcomp()“函数,我们可以在R中进行主成分分析。

”prcomp(iris[-5])->PCApca-R Interview Questons-Edureka

让我们看看不同主成分

screeplot(PCA)pca-R Interview Questions-Edureka29的变异性是如何降低的。你怎么知道一列的平均数呢?”

“让我们对虹膜数据集执行操作:

iris2-R Interview Questions-Edureka

我们将使用马赛克包

中的mean()函数mean(iris$Sepal.Length~iris$Species)

此命令给出不同种类虹膜花的萼片长度的平均值。

mean-R Interview Questions-Edureka

我们观察到“弗吉尼亚”的萼片长度最高,“刚毛”的萼片长度最低。

30。解释R中的“initialize()”函数

“initialize()函数用于在声明国家将正确处理这些数据。

最初,我们有一个水果名称的字符向量,让我们将其转换为一个因子:

fruit3-R Interview Questions-Edureka

将字符向量转换为一个因子可以使用a s.factor()函数:

as.character(fruit)->fruitfactor-R Interview Questions-Edureka

现在让我们看看向量的类:

rmse-R Interview Questions-Edureka4”38。给定一个数字向量,你如何将这些值转换成科学符号?”

“我们有下面的向量:

a用于读取.csv文件read_sas()->用于读取.sas7bdat文件read_excel()->用于读取xl sheets read_sav()->用于spss数据42。在R中指定一些可用于调试的函数?”

“这些函数可用于在R中调试:

traceback()debug()browser()trace()recover()43。如何检查R中类别变量的分布?”我们经常想知道一个分类变量的值是如何分布的。

我们可以使用table()函数来找到分类值的分布。

table(iris$Species)table-R Interview Questions-Edureka

现在,让我们找出这些值的百分比分布。

表(iris$Species)/nrow(iris)

percentage-R Interview Questions-Edureka

44。如何重命名数据帧的列?”

“通常列名不能传递列中的值的正确信息,因此我们需要重命名它们。”

让我们举一个例子来说明如何重命名列。

这是水果数据集,它由两列组成:

fruits_dataset-R Interview Questions-Edureka

我们看到列名没有提供任何关于它们中存在的数据的信息,所以让我们继续并重命名这些列。

colnames()函数用于重命名列。

colnames(水果)

和(is.na(employee))

现在,让我们删除ete缺少的值:

na.ommit(employee)

这是删除缺少的值后的结果:

employee_dataset-R Interview Questions-Edureka

46。什么是相关性?你将如何衡量R中的相关性?”“相关性”是一种测量两个变量之间关联强度的方法。

我们可以使用R中的cor()函数来查找相关系数。

我们将使用iris数据集:

iris-R Interview Questions-Edureka

来查找这些变量之间的关联程度变量,使用cor()函数

cor(iris[-5])

让我们看看结果:

iris_correlation-R Interview Questions-Edureka

如果相关系数接近 1,那么变量之间有很强的正相关关系。类似地,如果相关系数接近-1,则两个变量之间会有很强的负相关。

如果取“Sepal.Length”和“Petal.Length”,则相关系数为0.8717538,这意味着这两个变量之间存在很强的正相关。

47。如何从字符串中提取一个特定的单词?”

“stringR”包中的string_extract_all()函数可用于从字符串中提取特定模式。

sparta%filter(Age>60&Sex==”F“)

使用上述命令,我们正在筛选年龄大于60和“Sex”的值是女性。

filter-R Interview Questions-Edureka

49。您有一个雇员数据集,它由两列组成->“姓名”和“职务”,添加第三列将指示当前日期和时间

这是员工数据集:

employee-R Interview Questions-Edureka

我们可以使用cbind()函数

cbind(employee,date())

date-R Interview Questions-Edureka

50添加日期。在R中,两个表的叉积是多少?”

“”merge()”函数可用于执行R中的交叉积:

我们有两个表->“employee爨designation”和“employee爨salary”

employee爨designation表:其中包含“name”和“designation”

employee_designation-R Interview Questions-Edureka

employee爨salary表:其中包含“name”和“salary”

employee_salary-R Interview Questions-Edureka

按照下面的命令,我们将得到一个交叉产品:

merge(employee廑identification,employee廑salary,By=NULL)

merge-R Interview Questions-Edureka

对您的面试来说是最好的

查看Edureka的R认证培训,Edureka是一家值得信赖的在线学习公司,拥有遍布全球的250000多名满意的学习者。Edureka的数据分析和R培训将帮助您获得R编程、数据操作、探索性数据分析、数据可视化、数据挖掘、回归、情绪分析方面的专业知识,并将RStudio用于零售、社交媒体的真实案例研究。

你也可能喜欢

发表评论

您的电子邮件地址不会被公开。 必填项已用 * 标注

提示:点击验证后方可评论!

插入图片
人工智能 公司 投稿者
我还没有学会写个人说明!
最近文章
  • * 没有更多文章了
  • 热门搜索

    分类目录