买实体服务器做网站,一个域名怎么做两个网站,怎么利用花生壳做自己的网站,新浪军事网全文链接#xff1a;https://tecdat.cn/?p37952 分析师#xff1a;Ting Mei 在经济发展的大背景下#xff0c;居民消费结构至关重要。本文围绕居民消费结构展开深入研究#xff0c;运用 SPSS25.0 和 R 语言#xff0c;以因子分析法和主成分分析法对东北三省居民消费价格指… 全文链接https://tecdat.cn/?p37952 分析师Ting Mei 在经济发展的大背景下居民消费结构至关重要。本文围绕居民消费结构展开深入研究运用 SPSS25.0 和 R 语言以因子分析法和主成分分析法对东北三省居民消费价格指数及全国城镇居民消费性支出指标进行分析。通过数据标准化、效度检验等步骤找到公共因子揭示居民消费结构特点。在东北三省分析中明确了消费结构的因子及变化趋势全国范围的研究附代码数据则指出娱乐教育文化服务等是影响消费的主要因素且发现消费大小与经济发达程度相关点击文末“阅读原文”获取完整代码数据。 相关视频 本文还提出提高居民收入水平、改善消费结构、促进线上消费等建议。这些分析和建议为优化居民消费结构、促进地区经济发展提供了科学依据对政府、企业和居民都具有重要参考价值有助于推动经济可持续发展。 居民消费结构数据统计分析 由于直接对居民消费结构的各相关因素变量进行分析会受到多重共线性的影响使得所得模型并不稳定甚至与我们所认知的实际经济现象有所出入。因此本文将运用SPSS25.0软件以多元统计学中的因子分析法为基础通过对居民消费的各指标进行分析从而找到具有一定一致性的公共因子之后以此为变量进行后续的数据分析。 解决方案 任务/目标 运用 SPSS 软件对东北三省居民消费价格指数数据进行消费实例分析并得到公共因子以此为变量研究居民消费结构质量及其变化趋势。 数据选取 在各种关于居民消费的指标中居民消费价格指数最能体现消费水平的波动即能够反映居民在商品劳务等的消费过程中的满足程度。按照上一章描述的统计分析方法步骤对东北三省的居民消费价格指数近三年数据取平均数后进行后续的分析本文数据来源于国家统计局网站的分省月度数据。 数据标准化 对原始数据做标准化处理使得原始数据化为均值为0方差为1的数据。之后步骤皆以标准化后的数据作为样本进行分析。 效度检验 首先以标准化后的数据为变量进行运算得到它们的样本相关性系数矩阵 表相关性矩阵 x1x2x3x4x5x6x7x8相关性x11.000-0.623-0.739-0.472-0.469-0.090-0.4190.935x2-0.6231.0000.9140.8470.6190.6410.179-0.548x3-0.7390.9141.0000.9340.7900.6920.487-0.632x4-0.4720.8470.9341.0000.8470.8560.527-0.366x5-0.4690.6190.7900.8471.0000.5800.765-0.490x6-0.0900.6410.6920.8560.5801.0000.3080.107x7-0.4190.1790.4870.5270.7650.3081.000-0.408x80.935-0.548-0.632-0.366-0.4900.107-0.4081.000显著性单尾x10.0000.0000.0020.0020.2990.0050.000x20.0000.0000.0000.0000.0000.1440.000x30.0000.0000.0000.0000.0000.0010.000x40.0020.0000.0000.0000.0000.0000.013x50.0020.0000.0000.0000.0000.0000.001x60.2990.0000.0000.0000.0000.0320.264x70.0050.1440.0010.0000.0000.0320.006x80.0000.0000.0000.0130.0010.2640.006 从上述矩阵可以观察到所选八个消费支出指标间相关系数绝大部分比0.3要大且显著性概率小于0.05通过显著性检验说明要研究的数据适合做因子分析。 再利用KMO与Bartlett球形度检验且根据KMO的一般度量标准度量值越接近1表明效果越好。 因子提取 最初数据总方差绝对值为1提取后的因子总方差越接近于1说明公共因子对原始变量的信息丢失度越少解释越充分。所选数据的7个原始变量提取后的共同度即解释有效性都在0.7以上且大多数在0.9以上说明提取后的公共因子对于原始数据解释度大于70%信息提取充分。 本次实验共提取出样本相关系数前2个公共因子采用了特征值大于1为选取标准最后得到的两个公共因子累计方差贡献率达84.31 %故选用2个主因子解释东北地区历年居民消费支出的结构问题。 因子命名 最初得到的因子载荷矩阵各因子没有典型代表性因此为了得到各个公因子的经济意义继续进行因子旋转所采用的方法是最大方差法目的是使得因子载荷在取得平方项后的值向0、1方向靠近更好更直观地找到每个因子所表达的经济含义原理是降低因子综合性增加解释度。所得到因子载荷矩阵见表。 成分12Zscore(生活用品及服务类)0.958-0.268Zscore(教育文化和娱乐类)0.9550.201Zscore(居住类)0.814-0.550Zscore(交通和通信类)0.778-0.417Zscore(衣着类)0.746-0.443Zscore(医疗保健类)0.462-0.421Zscore(其他用品和服务类)-0.1020.987Zscore(食品烟酒类)-0.2340.935 于是得到消费结构的因子分析模型为 结合各指标的具体经济含义对每个因子给出合适的经济意义概括应该选取相关系数绝对值较大的这说明了此因子对该变量的代表性越强以上所得到的新的两个因子从更低维度但全面地展现了居民消费支出的情况同时也反映出居民支出由基本生存逐步发展的趋势。第一因子对原始数据方差贡献率达到几乎50%这可以说明东北地区的居民消费支出已经在向食品之外的类型。 点击标题查阅往期内容 R语言主成分PCA、因子分析、聚类对地区经济研究分析重庆市经济指标 左右滑动查看更多 01 02 03 04 因子得分 因子得分函数如下 之后根据表4利用主因子与方差贡献率可以知道他们的方差贡献率为第一个因子是49.18%第二个因子是35.13%由此得出综合评分函数如下 对于借助软件得到的因子得分结果中的数据进行选择性提取找到具有代表性的数据结果见表3-7。 时间FAC1FAC2F2018年6月0.5906-0.92813-0.042018年12月0.70039-0.849050.052019年2月0.75891-0.484420.22019年4月0.82016-0.311390.292019年12月0.366360.432420.332020年1月0.184861.664910.682020年6月-0.435451.345620.262020年12月-1.079940.57819-0.332021年1月-2.7612-1.5676-1.91 其中FAC1FAC2分别代表两个因子相应的的消费支出类别方面的得分F代表总消费结构得分。从中可以看出虽然东北地区以消费为主的第二因子在20182019两年几乎始终位于平均水平之下但整体结构上两个因子在这两年间整体均呈现上升趋势但是自1999年末之后F1发展因子开始出现明显下滑而以食物为主体的F2生存因子出现瞬间暴涨后飞速下跌这主要受到了新冠疫情的影响截止到目前两因子得分甚至不如2018年初说明该地区当前经济仍未回转。 建议 以上分析所发现的东北地区城镇居民消费结构产生的状况我们需要从多方面着手研究从而得到问题的解决措施结合实例分析所得到的结果也要考虑当地经济社会发展情况。 1努力提高居民收入水平 居民消费结构的优化在收入水平的高低的影响因素中占有相对重要的地位这是由于居民收入水平的高低决定了它对于所需求商品的支付能力所以为了优化地区的居民消费结构可以针对居民收入水平的提高做出一定的对策。对此我们可以通过增加就业岗位鼓励就业创造良好的就业环境以此来增加该地区的居民收入或者通过政府为企业就业岗位提供一些友好的政策提升劳动者的入职积极性。 2改善居民消费结构 想要对居民消费结构进行优化就要在满足居民生存性消费的基础之上对于发展以及享受型消费加大投入使得居民消费的结构化更加合理以推动地区的发展的更好适应。对于不同的消费领域还要给予相关经济投入以及政策支持在住房方面控制房屋价格上涨保障一般居民的住房问题在医疗方面加强基础医疗体质的便利同时也要关注居民在娱乐、旅行等服务业的需求。同时也要让各个产业自身积极创新并提升服务质量。 3积极促进线上消费 由于新冠疫情的出现打破了人们原先的生活节奏居民的各方面消费支出受阻校园学习、日常办公等都被迫转移到了线上因此在日常线下的消费开始迅速减少线上经济例如学生网课、外卖餐饮领域开始茁壮发展。所以我们应该顺应当前趋势积极促进线上消费的发展逐步恢复居民对于消费的活力并在稳定经济运行的前提下快速回转。 R语言、SPSS基于主成分分析PCA的中国城镇居民消费结构研究可视化分析|附数据代码 以全国31个省、市、自治区的城镇居民家庭平均每人全年消费性支出的食品、衣着、居住、家庭设备用品及服务、医疗保健、交通与通讯、娱乐教育文化服务、其它商品和服务等 8 个指标数据为依据 利用SPSS和R统计软件 采用主成分分析法对当前城镇居民消费结构进行分析 结果显示: 娱乐教育文化服务、交通通讯、家庭设备用品、居住、食品是影响消费大小变动的主要因素 而衣着、医疗保健、居住、食品是影响消费结构变动的主要因素; 各省市城镇居民消费大小与其经济发达程度密切相关; 相邻省市消费结构比较相似; 沿海地区与内地消费结构有较大的差别 第一步录入或调入数据 第二步打开“因子分析”对话框。 沿着主菜单的“Analyze→Data Reduction→Factor”的路径打开因子分析选项框 第三步选项设置。 首先在源变量框中选中需要进行分析的变量点击右边的箭头符号将需要的变量调入变量Variables栏中。在本例中全部8个变量都要用上故全部调入图4。因无特殊需要故不必理会“Value”栏。下面逐项设置 ⒈ 设置Descriptives选项。 单击Descriptives按钮图4弹出Descriptives对话框。 在Statistics栏中选中Univariate descriptives复选项则输出结果中将会给出原始数据的抽样均值、方差和样本数目这一栏结果可供检验参考选中Initial solution复选项则会给出主成分载荷的公因子方差这一栏数据分析时有用。 在Correlation Matrix栏中选中Coefficients复选项则会给出原始变量的相关系数矩阵分析时可参考选中Determinant复选项则会给出相关系数矩阵的行列式如果希望在Excel中对某些计算过程进行了解可选此项否则用途不大。其它复选项一般不用但在特殊情况下可以用到本例不选。 设置完成以后单击Continue按钮完成设置。 设置Extraction选项。 打开Extraction对话框。因子提取方法主要有7种在Method栏中可以看到系统默认的提取方法是主成分因此对此栏不作变动就是认可了主成分分析方法。 在Analyze栏中选中Correlation matirx复选项则因子分析基于数据的相关系数矩阵进行分析如果选中Covariance matrix复选项则因子分析基于数据的协方差矩阵进行分析。对于主成分分析而言由于数据标准化了这两个结果没有分别因此任选其一即可。 在Display栏中选中Unrotated factor solution非旋转因子解复选项则在分析结果中给出未经旋转的因子提取结果。对于主成分分析而言这一项选择与否都一样对于旋转因子分析选择此项可将旋转前后的结果同时给出以便对比。 选中Scree Plot“山麓”图则在分析结果中给出特征根按大小分布的折线图形如山麓截面故得名以便我们直观地判定因子的提取数量是否准确。 主成分计算是利用迭代Iterations方法系统默认的迭代次数是25次。但是当数据量较大时25次迭代是不够的需要改为50次、100次乃至更多。对于本例而言变量较少25次迭代足够故无需改动。 设置Scores设置。 选中Save as variables栏则分析结果中给出标准化的主成分得分在数据表的后面。至于方法复选项对主成分分析而言 选中Display factor score coefficient matrix则在分析结果中给出因子得分系数矩阵及其相关矩阵。 其它。 对于主成分分析而言旋转项Rotation可以不必设置对于数据没有缺失的情况下Option项可以不必理会。 Correlation Matrixa消费支出食品烟酒衣著居住生活用品及服务交通通信教育文化娱乐医疗保健其他用品及服务Correlation消费支出1.000.873.499.960.838.872.860.715.906食品烟酒.8731.000.262.811.663.755.620.396.751衣著.499.2621.000.377.646.424.355.606.649居住.960.811.3771.000.774.761.825.657.861生活用品及服务.838.663.646.7741.000.685.730.608.804交通通信.872.755.424.761.6851.000.774.624.727教育文化娱乐.860.620.355.825.730.7741.000.735.743医疗保健.715.396.606.657.608.624.7351.000.694其他用品及服务.906.751.649.861.804.727.743.6941.000a. Determinant 1.69E-014 Correlation Matrix(相关系数矩阵)一般而言相关系数高的变量大多会进入同一个主成分但不尽然除了相关系数外决定变量在主成分中分布地位的因素还有数据的结构。相关系数矩阵对主成分分析具有参考价值毕竟主成分分析是从计算相关系数矩阵的特征根开始的。 在Communalities(公因子方差)中给出了因子载荷阵的初始公因子方差Initial和提取公因子方差Extraction CommunalitiesInitialExtraction消费支出1.000.975食品烟酒1.000.659衣著1.000.362居住1.000.860生活用品及服务1.000.770交通通信1.000.754教育文化娱乐1.000.764医疗保健1.000.605其他用品及服务1.000.864Extraction Method: Principal Component Analysis. 在Total Variance Explained(全部解释方差) 表的Initial Eigenvalues初始特 7 征根中给出了按顺序排列的主成分得分的方差(Total)在数值上等于相关系数矩阵的各个特征根λ因此可以直接根据特征根计算每一个主成分的方差百分比% of Variance。 Total Variance ExplainedComponentInitial EigenvaluesExtraction Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %16.61373.47973.4796.61373.47973.4792.99211.02784.5063.5556.16290.6684.2983.31393.9805.2592.87996.8596.1311.45498.3147.088.98099.2948.064.706100.00098.213E-119.125E-10100.000Extraction Method: Principal Component Analysis. 主成分的数目可以根据相关系数矩阵的特征根来判定如前所说相关系数矩阵的特征根刚好等于主成分的方差而方差是变量数据蕴涵信息的重要判据之一。根据λ值决定主成分数目的准则有三 i 只取λ1的特征根对应的主成分 从Total Variance Explained表中可见第一、第二和第三个主成分对应的λ值都大于1这意味着这三个主成分得分的方差都大于1。本例正是根据这条准则提取主成分的。 ii 累计百分比达到80%~85%以上的λ值对应的主成分 在Total Variance Explained表可以看出前三个主成分对应的λ值累计百分比达到89.584%这暗示只要选取三个主成分信息量就够了。 iii 根据特征根变化的突变点决定主成分的数量 从特征根分布的折线图Scree Plot上可以看到第4个λ值是一个明显的折点这暗示选取的主成分数目应有p≤4。那么究竟是3个还是4个呢根据前面两条准则选3个大致合适但小有问题。 在Component Matrix成分矩阵中给出了主成分载荷矩阵每一列载荷值都显示了各个变量与有关主成分的相关系数。以第一列为例0.885实际上是消费支出与第一个主成分的相关系数。 Component MatrixaComponent1消费支出.987食品烟酒.812衣著.601居住.928生活用品及服务.877交通通信.868教育文化娱乐.874医疗保健.778其他用品及服务.930Extraction Method: Principal Component Analysis.a. 1 components extracted. R语言按地区划分的主成分可视化 res.pca - prcomp(data[, -1], scale TRUE) 关于分析师 在此对Ting Mei对本文所作的贡献表示诚挚感谢。她本科毕业于山西财经大学金融数学专业硕士就读于华北电力大学应用统计专业。会用 eviews、spss 处理数据且系统学习过 Python、MATLAB在数理统计和数理金融方面有扎实的知识基础。 本文中分析的数据、代码分享到会员群扫描下面二维码即可加群 资料获取 在公众号后台回复“领资料”可免费获取数据分析、机器学习、深度学习等学习资料。 点击文末“阅读原文” 获取全文完整代码数据资料。 本文选自《SPSS、R 语言因子分析FA、主成分分析PCA对居民消费结构数据可视化分析》。 点击标题查阅往期内容 数据分享|R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化 R语言逻辑回归logistic模型分析泰坦尼克titanic数据集预测生还情况 R语言是否对二分连续变量执行逻辑回归 R语言用lme4多层次混合效应广义线性模型GLM逻辑回归分析教育留级调查数据 R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析 R语言基于Bagging分类的逻辑回归(Logistic Regression)、决策树、森林分析心脏病患者 R语言逻辑回归Logistic回归模型分类预测病人冠心病风险 R语言用局部加权回归(Lowess)对logistic逻辑回归诊断和残差分析 R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化 R语言用线性模型进行臭氧预测加权泊松回归普通最小二乘加权负二项式模型多重插补缺失值 R语言Bootstrap的岭回归和自适应LASSO回归可视化 R语言中回归和分类模型选择的性能指标 R语言多元时间序列滚动预测ARIMA、回归、ARIMAX模型分析 R语言用lme4多层次混合效应广义线性模型GLM逻辑回归分析教育留级调查数据 R语言计量经济学虚拟变量(哑变量)在线性回归模型中的应用 R语言 线性混合效应模型实战案例 R语言混合效应逻辑回归mixed effects logistic模型分析肺癌数据 R语言如何用潜类别混合效应模型LCMM分析抑郁症状 R语言基于copula的贝叶斯分层混合模型的诊断准确性研究 R语言建立和可视化混合效应模型mixed effect model R语言LME4混合效应模型研究教师的受欢迎程度 R语言 线性混合效应模型实战案例 R语言用Rshiny探索lme4广义线性混合模型GLMM和线性混合模型LMM R语言基于copula的贝叶斯分层混合模型的诊断准确性研究 R语言如何解决线性混合模型中畸形拟合(Singular fit)的问题 基于R语言的lmer混合线性回归模型 R语言用WinBUGS 软件对学术能力测验建立层次分层贝叶斯模型 R语言分层线性模型案例 R语言用WinBUGS 软件对学术能力测验SAT建立分层模型 使用SASStataHLMRSPSS和Mplus的分层线性模型HLM R语言用WinBUGS 软件对学术能力测验建立层次分层贝叶斯模型 SPSS中的多层等级线性模型Multilevel linear models研究整容手术数据 用SPSS估计HLM多层层次线性模型模型 R语言高维数据的主成分pca、 t-SNE算法降维与可视化分析案例报告 R语言惩罚logistic逻辑回归LASSO,岭回归高维变量选择的分类模型案例 R语言有RStan的多维验证性因子分析CFA 主成分分析(PCA)原理及R语言实现及分析实例 R语言无监督学习PCA主成分分析可视化 R语言使用Metropolis- Hasting抽样算法进行逻辑回归 R语言多元Logistic逻辑回归 应用案例 R语言自适应LASSO 多项式回归、二元逻辑回归和岭回归应用分析 R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测 R语言基于树的方法决策树随机森林Bagging增强树 spss modeler用决策树神经网络预测ST的股票 R语言中自编基尼系数的CART回归决策树的实现 python在Scikit-learn中用决策树和随机森林预测NBA获胜者 matlab使用分位数随机森林QRF回归树检测异常值 基于随机森林、svm、CNN机器学习的风控欺诈识别模型 R语言惩罚logistic逻辑回归LASSO,岭回归高维变量选择的分类模型案例 R语言用标准最小二乘OLS广义相加模型GAM 样条函数进行逻辑回归LOGISTIC分