第一次写论文,手把手教你选数据分析方法

第一次写论文,手把手教你选数据分析方法


一、研究目的与问题

1研究目的

2 研究问题

研究问题则是研究目的的具体化,它通常以疑问句的形式出现,用以引导我们进行数据分析。一个大的研究目的会对应很多个小的研究问题,尤其是最开始拿到数据时,都会先进行基本的描述分析,掌握数据基本特征,为后续分析做铺垫。
研究问题则是研究目的的具体化,它通常以疑问句的形式出现,用以引导我们进行数据分析。一个大的研究目的会对应很多个小的研究问题,尤其是最开始拿到数据时,都会先进行基本的描述分析,掌握数据基本特征,为后续分析做铺垫。
例如,我们的一个小的研究问题可能是:“不同收入水平人群的消费水平是否有差异?”那么对应的我们就应该使用卡方检验进行差异性分析。对应上面讲到的一些研究目的,将方法进行展开介绍。
一、差异研究
常见的差异关系研究方法包括方差分析、t检验、卡方检验、非参数检验。
(点击方法名称直达帮助手册)
方法说明
方差分析多组定类数据与定量数据之间的差异性分析
t检验两组定类数据与定量数据之间的差异性分析
卡方检验定类数据与定类数据之间的差异性分析
非参数检验不满足正态/方差齐时使用
二、影响因素研究
相关分析常在回归模型分析前使用;线性回归和logistic回归分别对应不同类型Y进行回归模型分析;主成分分析和因子分析常用于信息浓缩和数据降维;中介效应和调节效应是基于回归模型进行更深层次研究;路径分析和结构方程模型用于研究多个潜变量之间的影响关系,对于模型的结构有很高的要求。(点击方法名称直达帮助手册)
方法说明
相关分析变量之间的相关关系研究,常在回归分析前使用
线性回归因变量为定量数据时,研究影响关系
logistic回归因变量为定类数据时,研究影响关系
主成分分析提取主要影响因素、提取公共因子、降低维度
因子分析提取主要影响因素、提取公共因子、降低维度
中介效应研究X对Y的影响时,是否会先通过中介变量M,再去影响Y。
调节效应研究X对Y的影响时,是否会受到调节变量Z的干扰。
路径分析研究多个自变量和多个因变量之间的影响关系
结构方程模型同时研究测量关系与影响关系
三、指标体系构建
毕业论文中评价指标体系构建包括两大部分内容,分别是权重计算和优劣评价。其中权重计算方法最常用的为AHP层次分析法和熵值法,优劣评价中TOPSIS法和模糊综合评价比较常用。(点击方法名称直达帮助手册)
权重计算方法说明
层次分析法主观赋权法,通过专家打分方法确定权重
熵值法客观赋权法,通过熵值的大小确定权重大小
灰色关联法通过比较各个因素与母因素的关联程度来确定权重大小
主成分分析适用于将多个指标转换为几个综合指标然后进行权重计算
因子分析通过计算每个指标的因子载荷矩阵然后进行权重计算
优劣评价方法说明
TOPSIS法通过比计较评价对象与理想解之间的距离对比优劣程度
模糊综合评价通过模糊数学理论综合评价对象的多个方面
秩和比通过对评价指标进行排序并赋予秩次,在进行加权求和得出评价结果
数据包络分析通过比较决策单元在输入输出指标上的最优解和实际解,得出效率评价结果
四、问卷调查研究
问卷调查研究类通常分为两大类:量表类问卷和非量表类问卷,分析思路框架可查看下面这篇公众号文章。
毕业论文写作 | 问卷分析思路框架整理(量表&非量表)
五、预测模型
预测类模型常用有三大类:时间序列类预测方法,如指数平滑法和灰色预测模型;回归类预测方法,包括线性回归、logistic回归、非线性回归等,它们通过建立数学模型来预测数值结果;机器学习类预测方法,如决策树、随机森林和神经网络等。
查看下方文章:
常用预测类数据分析方法分类汇总
六、满意度研究
满意度研究通常涉及收集和分析客户对产品或服务的反馈,以了解客户的需求和期望,评估产品或服务的质量和满足客户需求的能力,以及提出改进产品或服务的建议。常用的方法有四分图(象限图)、KANO模型、层次分析法、结构方程模型、评价指标体系构建等。
方法说明
四分图简单实用的满意度评价模型,可快速找出问题关键,区分轻重缓急
KANO模型根据客户满意度和功能具备程度对功能进行分类,找出用户对于各类需求的排名偏好情况
层次分析法辅助判断顾客满意度评价的研究模型
结构方程模型通常是通过量表的形式收集问卷进行满意度模型的构建与分析
评价指标体系等满意度研究过程常借助评价指标体系构建进行
七、现状政策类研究
双重差分法是一种政策效应评估方法,它通过比较政策实施前后的变化来评估政策对目标群体或更广泛社会的影响。倾向得分匹配是一种用于处理选择性偏差的技术,它通过匹配控制组和实验组样本的方式,模拟一个无偏估计的实验结果,二者常用于政策评估。
DID双重差分法
PSM倾向得分匹配
八、试验设计
试验研究常通过正交试验的过程希望得到一个最优试验组合,使得目标结果最大或者最小。该过程可以使用极差分析或者方差分析得到最优试验组合。其中极差分析为直观分析法,简单易懂,方便快捷,但是不涉及变量显著性分析,如果要分析变量显著性及在何种水平上显著,应该使用多因素方差分析。
正交试验
极差分析
多因素方差分析

二、数据类型与特点

1数据类型辨析

2分析方法选择

三、数据可靠性与完整性

1异常值处理

2缺失值处理

四、方法的可行性

[关键词]: