分类器指标评定
一定正确率的前提下,具有较高召回率。
大数据与深度学习
大数据:超出常用软件工具捕获,管理和处理能力的数据集
机器学习关心通过程序自我改进;数据挖掘关心从数据中提取模式,重点在于算法的应用。
机器学习与数据挖掘的关系:
数据挖掘是个过程,在此过程中机器学习算法被用作提取数据集价值的工具。
大数据与深度学习关系:
深度学习是一种模拟大脑的行为
深度学习对大数据发展有所帮助
深度学习转变了解决问题的思维
大数据的深度学习需要一个框架
局部最优与全局最优
局部最优指的是有限区域内的最小值;全局最优指的是空间整个区域最小值。
局部极小点函数值小于等于附近的点;
全局极小点函数值小于等于所有可行点。
逻辑回归
回归划分:
连续的,称多重线性回归;二项分布,称Logistic回归;Poisson分布,称Poisson回归;负二项分布,称负二项回归。
Logistic回归因变量可以是二分类(常用),也可以是多分类。
适用性:概率预测、分类、寻找危险因素、仅用于线性问题、不独立假设,但独立计算。
逻辑回归与朴素贝叶斯
逻辑回归用来生成,朴素贝叶斯用来识别;
朴素贝叶斯属于贝叶斯,逻辑回归属于最大似然;
朴素贝叶斯需独立假设;
逻辑回归要求特征为线性。