机器学习-07

    1. 下列哪一个是强化学习的算法

分析:Q-Learning是强化学习算法中value-based的算法,参考:https://blog.csdn.net/qq_30615903/article/details/80739243arrow-up-right

    2. 下列哪一个不是强化学习的基本要素

分析:强化学习的基本要素

  1. 环境状态(选项A中环境模型Environment Model)

  2. Agent的动作

  3. 环境奖励(奖励函数Reward Function)

  4. 策略

  5. 状态转移概率

  6. 累积回报

  7. 状态价值函数(价值函数Value Function)

  8. 状态行为值函数

    3. 下列哪些算法属于无监督学习(Unsupervised Learning)的算法

分析:ARIMA模型(英语:Autoregressive Integrated Moving Average Model),是时间序列预测分析方法之一。

    4. 下列哪项不属于数据挖掘分析方法

    5. 下列哪项不是因子分析参数估计的常用方法

    6. 下列哪个决策树的算法采用盆栽法(Bonsai Technique)由上而下(Top-Down)的方式来剪枝?

    7. (一级题)下列哪个插件是用于建立数据模型?

    8. 下列何种算法可以了解各产品间的先后购买的关系及概率值

    9. 下列何种集成的方法只可以适用于决策树的模型

    10. (和下边题重复)下列何种集成的方法,会重复抽取训练数据集中的数据,且每笔被抽中的概率相等

    11. 下列何种集成的方法,会重复抽取训练数据集中的数据,且每笔被抽中的概率始终保持一样?

    12. (和下边题重复)下列何种集成的方法,会重复抽取训练数据集中的数据,且每笔被抽中的概率不一定相等?

    13. 下列何种集成的方法,会重复抽取训练数据集中的数据,且每笔被抽中的概率不见得相等?

    14. 下列何者不是决策树字段选择的度量

分析:决策树的基准选择

算法
基准

ID3

Information Gain,信息增益

C4.5/C5.0

Gain Ratio,信息增益比

CART

Gini Index,基尼系数

CHAID

Chi-Square Statistic,卡方统计量

    15. 下列何者不是聚类分析的算法

    16. 下列关于有监督学习和无监督学习不正确的是

    17. 下列关于线性回归中的残差说法正确的是

缺分析:残差均值为什么等于零?

    18. 下列关于数据挖掘说法正确的是

    19. 下列关于逻辑回归模型中计算得到的发生概率p,阐述错误的是

    20. 下列关于逻辑回归介绍错误的是

    21. 下列关于逻辑回归阐述正确的是

    22. 下列关于逻辑回归表述错误的是

    23. 下列关于关联规则和协同过滤说法错误的是

    24. 下列关于分类器的说法中不正确的是

    25. 下列关于多为尺度分析阐述正确的是

    26. 下列关于层次聚类描述不正确的是

    27. 下列关于K-Means聚类描述不正确的是

    28. 下列关于“基于用户的协同过滤”和“基于物品的协同过滤”的说法错误的是

    29. 下列关于“基于用户的协同过滤”和“基于物品的协同过滤”的说法错误的是

    30. 下列对于生成式对抗网络的叙述,何者有误

分析:生成对抗网络是半监督的。

    31. 两个点在标准坐标系上的绝对轴距总和指的是

    32. 利用历史数据来构造训练(Training)数据集、验证(Validation)数据集和测试(Test)数据集时,验证数据集的作用在于

    33. 可用作数据挖掘分析中的关联规则算法有

    34. 可以通过以下哪种方法,检验出多重共线性问题

    35. 考虑下面的频繁3-项集的集合:

  • {1,2,3}

  • {1,2,4}

  • {1,2,5}

  • {1,3,4}

  • {1,3,5}

  • {1,4,5}

  • {2,3,4}

  • {2,3,5}

  • {3,4,5}

    假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包括:

    36. 决策树中的信息获取(Information Gain)的计算是用来?

    37. 决策树中的Information Gain的计算是用来?

    38. (重复)决策树中不包含以下哪种节点?

    39. 决策树中不包含以下哪种节点

    40. 决策树中不包含以下哪种节点?

    41. 决策树建模时一个必要的步骤是决策树的修剪,下列何者不是决策树需要修剪的原因?

    42. 聚类方法中哪种方法计算两个类(两椭球)之间的距离较少收到异常值的影响?

    43. 教育水平可以被分为小学、中学、大学、硕士、博士5类,若需要对其进行哑变量转换,应转成几个变量?

    44. 将原始数据进行集成、变换、维度规约、数值规约是以下哪个步骤的任务

    45. 将复杂的地址简化成北、中、南、东四区是在进行

    46. 简单贝式分类(Naive Bayes)可以用来预测何种数据型态

    47. 假设长度为2的频繁项目集(Frequent Itemset)有

  • {A,B}

  • {A,E}

  • {B,D}

  • {B,F}

  • {D,F}

  • {D,G}

    请问以下那一个是长度为3的候选项目集有?

    48. 假设{BCE}为一频繁项目集(Frequent Itemset),则根据Apriori Principle以下何者不是子频繁项目

    49. 加入我们使用非线性可分的SVM目标函数作为最优化对象我们如何提高模型表现

    50. 加入我们使用非线性可分的SVM目标函数作为最优化对象,我们怎么保证模型线性可分?

最后更新于