湄洲岛网站建设,昆明外贸网站设计服务商,优设网官网app,网页设计html代码大全图片描述型统计 描述统计
1.集中趋势 #xff1a;众数、平均数、分位数
2.离散趋势#xff1a; 极值#xff08;max#xff09;、极差#xff08;max-min#xff09;、平均差、方差、标准差、分位差
3.分布#xff1a;峰泰、偏度 推理型统计
概率分布#xff1a;离散型…描述型统计 描述统计
1.集中趋势 众数、平均数、分位数
2.离散趋势 极值max、极差max-min、平均差、方差、标准差、分位差
3.分布峰泰、偏度 推理型统计
概率分布离散型分布、连续型分布
离散型分布
二项分布如抛硬币n次不同正面朝上的次数对应的概率 几何分布如抛硬币n次到第k次才取得第一次成功的概率服从的分布 泊松分布在一定时间范围内发生概率相同给定其发生的平均发生的次数μ则事件在该事件范围内发生k次的概率服从泊松分布
概率分布
连续型分布
正态分布 2.假设检验
无效假设
备择假设
样本抽样
结果检验
假设检验基本步骤
1建立原假设
2选择检验统计量
3寻找拒绝阈
计算样本统计量的值和临界值做比较做判断
数据分析里的统计学模型
回归模型
聚类模型
贝叶斯模型
1.回归
某些因素对目标的影响程度也就是影响因子
2.相关性分析
研究事务的因果联系
3.避免伪相关先定性
1.从业务逻辑出发不断拆解指标下钻
2.ABtest实验测试因素是否对结果产生影响
3.找相关指标或因素替代或直接删除
4.定量回归分析
1.确定x、y
x自变量
y: 因变量
2.建立回归模型
3.回归检验
1.Multiple R:也就是R值表明自变量与因变量之间相关性大小的值 2 .R Square: R的平方值是指拟合系数是自变量解释因变量差距的大小 3.Adjusted R Square:调整后的R square,说明自变量能说明因变量百分比 4.标准误差: 用来衡量拟合程度的大小1 5.观察值:用于训练回归方程的样本数据有多少个; 6.SignificanceF: 是指显著性检验度其实就是我们上节课讲到的P值 7.T Stat: T检验中统计量t值用于对模型参数的检验 8. Value P:是指系数的显著性检验度
总结
回归模型
定性分析相关性分析、怎么定性
定量分析规范回归y定义清晰、x精准有力、怎么定量 二、聚类模型
分类已知分类标准和规则
聚类根据数据本身的特性研究分类方法并遵循这个分类方法对数据进行合理的分类最终相似数据为一组同类相同、异类相异
3、聚类步骤
第一步确定分组k0
第二步随机选k个值为数据中心选择A、B两个点为初始中心
第三步其他数值与数据中心的距离
第四步重新选择数据中心
第五步再次计算距离
第六步再次重新选择数据中心
第七步再次计算距离