基于多变量方差模糊聚类算法的无手机恐惧症研究

时间:2023-09-07 12:55:04 来源:网友投稿

王小红

(陕西省委党校,文化与科技教研部, 陕西,西安 710061)

无手机恐惧症(Nomophobia)2008年在英国首次出现,其实质是害怕失去与手机的联系,当人们无法使用手机或无法利用这些设备提供的功能时,会感到不适或焦虑。这种恐惧症是随着通讯技术的发展而出现的。无手机恐惧症是由于智能手机所提供的即时通讯和满足感而形成的一种心理障碍,并表现为一种强迫性和成瘾行为。目前,对于手机危害性研究大多以心理研究和社会行为研究为主[1-4],而以智能算法为工具的数据分析方法很少。再者,由于调查数据庞大,数据特征不明晰,如果利用现有智能算法去进行研究,肯定会影响数据分析的结论与对策。因此,本文以多变量方差模糊聚类算法为理论依据,利用模糊聚类理论去分析数据之间内外的关联,利用方差去衡量聚类精度,进而,提高对调查问卷数据分析的准确度与客观性。

多变量方差分析是一种基于多元方差分析方法,它不仅能够分析多个观测数据(控制变量)对其它被观测数据的独立干扰与影响,而且还可以根据多个观测数据(控制变量)的变化与交互,来监控被测数据的变化,并通过优化迭代最终找到适合分析的最优观测数据组合。在多变量方差分析中,观测数据(观测量)的变化取决于以下三个因素:一是观测数据独立作用的影响;
二是观测数据相互搭配后对被观测变量产生的影响;
三是抽样误差影响。因此,基于多变量方差分析可以定义为[5]

ST=SA+SB+SAB+SSE

(1)

其中,SA、SB分别表示由观测数据A、B独立作用引起的差变,SAB为控制变量A、B两两交互作用引起的变差,SSE为随机因素引起的变差。通常称SA+SB+SAB为主效应,SAB为N向(N-WAY)交互效应,ST表示为总观测数据,它可以用下式来表示:

(2)

(3)

(4)

对测试数据进行处理过程中,外界随机因素引起的变差SSE可以通过下式来表示:

(5)

SAB=SST-SA-SB-SSE

(6)

根据式(6)可以发现,在测试数据交互作用中的变差式中,当变差式SA的值在式中的比例较大时,则说明测量控制数据A是引起观测数据变量变化的主要因素,因此,被观测数据变化趋势可以拟由控制测试数据变量A来决定;
相反,如果变差式SA的值所占比例较小,则说明测量控制数据A不是引起观测变量变动的主要因素,则观测变量的变化趋势无法用控制测量数据变量A来解释。因此,在多变量方差分析中,可以预先将控制变量(测试数据)划分为固定测试变量和随机测试变量。在随机测试变量模型中,应首先对A、B的交互作用进行推断,然后再分别依次对A、B的效应进行检验[9]。在多变量测试数据方差分析中,对于不同测试数据统计量的检验计算如下式:

(7)

(8)

(9)

在上式中,对不同测试数据进行统计量检验计算均采用F校验。为了确保测试数据分析的正确性,在对调查问卷数据进行数据挖掘分析过程中,本文采用数理统计多元分析模糊聚类法,在多变量方差数据分析的基础上,对测试数据进行聚类,从而客观的对测试数据进行评价与分析。

本文引入模糊聚类算法,将调查数据按一定要求对其进行数理统计,科学地评判调查问卷测试样本数据之间的逻辑关系,从而客观地对问卷情况进行类型划分。为后续调查问卷数据的NMP-Q量表分析奠定基础,模糊聚类通常采用如下的公式:

S={xi(k)|xi(k)∈x(k)}

(10)

其中,S为调查问卷某项数据集合,k为数据集合中数据序列,i表示调查问卷数据的项,x(k)表示调查问卷中某项数据集合中的样本向量,其含义与式(2)中的x相同。

为进一步衡量调查数据分析的准确性,现定义如下的性能指标函数,来确定调查问卷中同一类数据之间的聚类精度。

(11)

其中,Ci为定义的聚类中心,它是随着测量数据分析过程进行变化的。为了限制调查问卷数据分析过程中聚类中心变化的越界,特定义如下的聚类中心变化函数来对其进行约束:

(12)

其中,u(xi(k))为测试数据分析过程中模糊聚类隶属度函数。

将由式(10)~式(12)所得到的测量数据xi带入式(1)~式(5),则可以得到调查问卷数据的多变量方差分析模糊聚类分析数据,再通过采用NMP-Q量表对其进行大数据分析,对中国大学生无手机恐惧症现状进行客观评价。

3.1 调查问卷设计

采用NMP-Q量表为原型设计调查问卷,问卷中量表的四个维度20个问题(见图1),每个问题答案都使用李克特7分制评分,问卷包含与人口统计相关的问题,如性别、年龄、拥有手机的年限、几年级学生、每天使用手机时间长短等。问卷数据分别来自陕西、山西、青海、贵州、湖南地区的高等院校学生。

图1 改进HS算法流程图

3.2 样本情况介绍

本次调研总共收集到1 627条数据,由于本次问卷调查是采用网络宣传采集数据,有些人没有看清楚调查对象,有已毕业的对象也填了本次问卷,所以去除已毕业的130条数据,剩下1 497个有效样本,性别统计:女生占65.7%(984人),男生占34.3%(513人)。学生所在年级统计:大一学生占39.8%(596人),大二学生占40.3%(604人),大三学生占15.8%(237),大四及研究生学生占4.0%(62人)。拥有智能手机的年限统计:1年以下的占3.9%(58人),1年-2年之间的占13.2%(197人),3年-4年之间的占34.1%(510人),5年-6年之间的占34.1%(511人),7年-8年之间的占9.8%(146人),8年以上的占5.0%(75人)。学生所在院校统计:大中专院校占74.5%(1 116人),本科院校占25.5%(381人)。智能手机用户的平均年龄为20.06岁(SD=1.95),大部分是大一、大二和大三学生。使用智能手机的平均时间为4.96年(SD=2.59)。每天使用手机的平均时间为3.72小时(SD=2.50)。

3.3 样本数据多变量方差模糊聚类分析

在进行多变量方差分析(MANOVA)测试之前,通过使用模糊聚类方法将数据中的年龄、使用手机的年限和每天使用手机的时间等变量分成了几类。然后,采用式(1)~式(9)对测试数据进行检验和独立样本T检验,研究大学生的无手机恐惧行为在性别、年龄、每天手机使用时间等方面是否存在差异。其次,通过计算问题负荷对NMP-Q各因子的平均得分,来构建样本的NMP-Q因子得分,探究大学生的无手机恐惧症行为,分析结果如表1。

表1 NMP-Q量表项分析

表2中,与其他因素相比,大学生对无法沟通(M=4.81,SD=1.464)和失去联系(M=4.76,SD=1.540)的恐惧程度更高。情绪因手机或功能不能使用而恼火(M=3.97,SD=1.602)得分最低。

在假设F=6.923,相伴概率p=0.009<0.05,T统计量的相伴概率p=0.024<0.05。进而,男性和女性在量表总分的平均值上存在显著性差异。此外,对四个维度平均值的比较显示,女性的无手机恐惧症得分高于男性(见表2)。

表2 无手机恐惧症性别统计得分的均值和标准差

采用式(7)~式(10)对被测数据的方差进行检验,显著性值为0.111>0.05,说明本次分析结果可信。对各年级学生的问卷总得分进行方差检验,F=3.507,相伴概率p=0.015<0.05,说明学生所在年级在无手机恐惧症行为上有统计学上显著差异。结果是在维度1无法访问信息上无显著性差异,在维度2失去联系、维度3无法沟通和维度4带来不方便上显著性差。大一和大二学生在维度2、3和4上有明显差异,并且大二学生得分高于大一学生(见表3)。

表3 无手机恐惧症学生年级统计得分的均值和标准差

而且,根据分析可以发现,每天使用手机时间越长的样本问卷得分越高,患无手机恐惧症的可能性越大(见图2),而院校类型对问卷得分的高低无显著性差异。

图2 每天使用手机时间长短和问卷得分的关系

本论文设计了一种模糊聚类多变量方差大数据分析方法,完成了大学生手机依赖症调查数据的分析,客观评价了无手机恐惧症行为对大学生群体的影响。结果显示拥有手机年限和每天使用手机时间长短对年轻人的无手机恐惧症有影响。由于手机的功能不断在增强,年轻人对“无手机恐惧症”可能变得更加严重。在网络调查中,由于调研数据采集院校划分不明晰。因此,在后续研究中有待拓宽更广泛的年龄群体,以便调查数据分析更为客观。

猜你喜欢恐惧症测试数据方差错失恐惧症英语文摘(2021年12期)2021-12-31密集恐惧症英语文摘(2021年2期)2021-07-22概率与统计(2)——离散型随机变量的期望与方差中学生数理化(高中版.高考数学)(2021年3期)2021-06-09方差越小越好?中学生数理化·七年级数学人教版(2019年6期)2019-06-25计算方差用哪个公式中学生数理化·七年级数学人教版(2019年6期)2019-06-25测试数据管理系统设计与实现科学与财富(2018年30期)2018-12-28方差生活秀初中生世界·九年级(2017年10期)2017-11-08我有开学恐惧症科普童话·神秘大侦探(2017年3期)2017-03-16基于自适应粒子群优化算法的测试数据扩增方法计算机应用(2016年9期)2016-11-01空间co-location挖掘模式在学生体能测试数据中的应用体育科技(2016年2期)2016-02-28

推荐访问:方差 多变 算法