数据挖掘工程师最新试题
(判断题)
DBSCAN是相对抗噪声的,并且能够处理任意形状和大小的簇。
(简答题)
数据挖掘要解决的问题是什么?
(简答题)
为什么朴素贝叶斯分类称为“朴素”的?简述朴素贝叶斯分类优缺点。
(简答题)
简述特征子集选择的搜索策略。
(判断题)
噪声和伪像是数据错误这一相同表述的两种叫法。
(判断题)
特征提取技术并不依赖于特定的领域。
(简答题)
已知数据元组中age的值如下(按递增序): 13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,33,35,35,35,35,36,40,45,46,52,70。 (a)使用min-max规范化,将age值35转换到[0.0,1.0]区间。 (b)使用z-score规范化转换age值35,其中,age的标准偏差为12.94年。 (c)使用小数定标规范化转换age值35。
(简答题)
以下是一个商场所销售商品的价格清单(按递增顺序排列,括号中的数表示前面数字出现次数) 1(2)、5(5)、8(2)、10(4)、12、14(3)、15(5)、18(8)、20(7)、21(4)、25(5)、28、30(3)。 请分别用等宽的方法和等高的方法对上面的数据集进行划分。
(简答题)
一个数据仓库系统的建立通畅需要经过哪些步骤?
(单选题)
关于K均值和DBSCAN的比较,以下说法不正确的是()。
(单选题)
以下两种描述分别对应哪两种对分类算法的评价标准?() (1)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。 (2)描述有多少比例的小偷给警察抓了的标准。
(单选题)
以下是哪一个聚类算法的算法流程()。 ①构造k-最近邻图。 ②使用多层图划分算法划分图。 ③repeat:合并关于相对互连性和相对接近性而言,最好地保持簇的自相似性的簇。 ④until:不再有可以合并的簇。
(判断题)
离散属性总是具有有限个值。
(简答题)
依据类信息可利用的程度,离群点挖掘可分为哪三种基本方法?
(单选题)
对于下图所示的正倾斜数据,中位数、平均值、众数三者之间的关系是()
(简答题)
什么是数据仓库的3层数据结构?
(简答题)
请描述主成份分析(PCA)算法步骤
(单选题)
关于OLAP的特性,下面正确的是:()。 (1)快速性 (2)可分析性 (3)多维性 (4)信息性 (5)共享性
(填空题)
粒度是对数据仓库中数据的综合程度高低的一个衡量。粒度越小,细节程度越高,综合程度越低,回答查询的种类()
(填空题)
数据挖掘的效果直接受到()的影响。