欢迎来到易发表网,发表咨询:400-808-1701 订阅咨询:400-808-1721

关于我们 期刊咨询 科普杂志

数据分析的前景优选九篇

时间:2023-05-24 18:03:21

数据分析的前景

数据分析的前景第1篇

关键词:大数据 教育系统 应用前景

中图分类号:G64 文献标识码:A 文章编号:1003-9082(2016)01-0089-01

大数据是信息技术快速发展的产物,其对教育系统能够产生深远的影响。以数据的形式呈现教育给教育领域带来了一次革新。在大数据模式之下,可以分析学生学习行为和变化的内在联系性,可以有效的挖掘教育领域更加深层次的问题。进入新世纪第一个十年间,大数据这个名词的出现为教育领域带来了全新的模式和挑战。学校在办学过程中,拥有了越来越多真实的、有用的、有价值的海量数据信息。这些强大的数据资源可以为教育发展提供强有力的智力支持和数据分析,在教育系统中大数据的应用具有强大的教育工具价值和时代意义。而积极探索将大数据如何应用到教育系统中,是需要我们重点思考的一个问题。

一、国外教育系统应用大数据的现状分析

大数据应用到教育系统中,能够对学生从小学到大学各个时期的学习行为、考试成绩以及职业规划进行详细的关联分析和研究。在国外很多这样的数据信息已经被国外政府机构完好的保存起来,用于今后的统计和分析。现阶段,大数据分析已经被应用到发达国家像美国、日本等国家的公共教育系统中,其成为了促进本国教育系统改革的重要信息基础。为了顺应时展的步伐,美国政府部门在2012年投入一项花费2亿美元的公共教育大数据计划,通过这个项目美国政府希望能够对美国的教育体系进行完善和改革。进入新世纪以后,在美国的教育系统中,逐渐兴起了一股在线教育的潮流,通过这种教育哈弗和麻省理工大学可以收集大量的数据,从而更好的研究世界各地各个国家的教学模式和学习行为,从而打造出适合不同国家学生学习的在线教育平台。通过记录学习者鼠标的点击数量,可以对学习者的学习行为和学习轨迹进行研究,发现不同类型的学习者对不同知识点的反应情况,用多少时间去学习,哪些知识点需要重复讲解或者强调,哪些学习工具和学习方式能够提高学生的学习效率。在追踪个人学习数据时,虽然是杂乱无序的,但是当很多人的数据收集到一定程度之后,群体行为就会在数据中呈现出一种规律,通过分析这些数据的内在联系性,在未来在线教育平台建设过程中才能弥补没有教师面对面交流指导存在的不足,提高知识传播的针对性,比如知识对受教者的投放强度、进度、反馈等。

二、大数据在教育领域应用的前景分析

1.利用大数据研究学生行为和变化内在的联系性

通过目前各类已广泛使用的教育信息系统途径,学生的行为会被各种数据所自动保留,例如学生在学校的时间、按时上课的情况、课堂听讲是否积极主动。在应用过程中以互联网技术和云计算等综合技术为基础,在对学生管理过程中,从数据库中寻找有价值的数据信息,经过全过程性和综合性分析,找到学生与知识之间存在的内在联系性,分析背后隐藏的逻辑关系,并做出合适的教学决策。在学校中积极应用计算机技术和智能通信设备保障了学生和家庭、学生和教师、学生和社会之间的沟通和交流。在大数据背景下,学生在学校的各种表现都可以用数据形式真真切切的反应出来。其能够表现当下学生的行为表现。一方面,可以通过学生之间的行为变化发现内在的联系性。一方面,大数据时代可以显示学生的历史行为,各种数据表单都能够记录下来。通过这些数据我们可以发现学生的学习兴趣,特长爱好等因素。另一方面,大数据可以通过云计算反应学生的变化趋势。学生的变化通常情况下都是不是很明显,只有当学生出现问题之后,才能发现,而数据从开始到结束是有时间差的,这样就可以通过数据提早发现学生的变化,避免产生不良的结果。

2.利用大数据挖掘学生内在特征

传统教学模式通常都以学生的考试成绩判断学生是否优秀,忽视了学生自主发展的空间。例如两个学生在物理考试中都取得了90分的成绩,从表面上看两个学生的分数是一样的,但是通过大数据分析可以发现,一个学生在学习过程中主要依靠的是思维能力,而另一个学生主要靠死记硬背取得高分,结果相同,但是过程明显不同,在未来这两个的人个各自的发展也不尽相同,其中以逻辑思维能力学习的学生,在今后的学习中能够更加顺畅,发展更加长远。而凭借记忆取得好成绩的学生思维能力不足,对今后的学习十分不利。相同的结果不一定具备相同的知识结构,成绩会掩盖一些不足的地方,会影响学生全面发展,而大数据能够反映学生阶段性的自我认知,对个人成长具有指导性作用,帮助学生弥补能力方面的不足,能够更加全面的反应学生在发展过程中存在的问题和风险。

3.利用大数学实现个性化教学

随着智能互联网时代的广泛普及,我们生产生活中传统基础业务系统和当前新起的物联网系统之间异构互联,产生的交互数据高效率地渗透到社会各类行业领域,为我们记录个人行为数据提供了便利的载体。更为重要的是,在这些强大数据收集终端面前,人们没有掩饰的意图,从而收集着过去无法收集及没有梳理的数据,这些海量数据让社会科学从宏观向着微观转变,让跟踪每一个人的数据都成为可能。将这些海量数据应用到教学中,实现对学生的个性化教学。在实际教学过程中,为学生提供一个个性化的教学环境是新课程改革的要求,在大数据的帮助之下,个性化的教育方式正在逐渐成为可能。大数据时代,个性化已经为教育领域提供了现实的路径,通过网络数据分析学生的兴趣、爱好、行为习惯和行为表现,然后对这些数据进行个性化判断,最终实现个性化的教育模式。在中国,个性化教学教师就是通过掌握学生的学习过程的各种数据,进行重点把握,了解学生的学习基础,从而分析学生对知识的掌握程度,避免学习过程重点的重复,以便为学生进行准确的定位。

参考文献

数据分析的前景第2篇

摘要:介绍了数据融合技术的基本概念和内容,分析了该技术在森林防火、森林蓄积特征的估计和更新、森林资源调查等方面的应用,提出该技术可应用于木材无损检测及精确林业。融合机器视觉、X射线等单一传感器技术检测木材及木制品,可以更准确地实时检测出木材的各种缺陷;集成GPS、GIS、RS及各种实时传感器信息,利用智能决策支持系统以及可变量技术,能够实现基于自然界生物及其赖以生存的环境资源的时空变异性的客观现实,建立基于信息流融合的精确林业系统。

多传感器融合系统由于具有较高的可靠性和鲁棒性,较宽的时间和空间的观测范围,较强的数据可信度和分辨能力,已广泛应用于军事、工业、农业、航天、交通管制、机器人、海洋监视和管理、目标跟踪和惯性导航等领域。笔者在分析数据融合技术概念和内容的基础上,对该技术在林业工程中的应用及前景进行了综述。

一、数据融合

1.1概念的提出

1973年,数据融合技术在美国国防部资助开发的声纳信号理解系统中得到了最早的体现。70年代末,在公开的技术文献中开始出现基于多系统的信息整合意义的融合技术。1984年美国国防部数据融合小组(DFS)定义数据融合为:“对多源的数据和信息进行多方的关联、相关和综合处理,以更好地进行定位与估计,并完全能对态势及带来的威胁进行实时评估”。

1998年1月,Buchroithner和Wald重新定义了数据融合:“数据融合是一种规范框架,这个框架里人们阐明如何使用特定的手段和工具来整合来自不同渠道的数据,以获得实际需要的信息”。

Wald定义的数据融合的概念原理中,强调以质量作为数据融合的明确目标,这正是很多关于数据融合的文献中忽略但又是非常重要的方面。这里的“质量”指经过数据融合后获得的信息对用户而言较融合前具有更高的满意度,如可改善分类精度,获得更有效、更相关的信息,甚至可更好地用于开发项目的资金、人力资源等。

1.2基本内容

信息融合是生物系统所具备的一个基本功能,人类本能地将各感官获得的信息与先验知识进行综合,对周围环境和发生的事件做出估计和判断。当运用各种现代信息处理方法,通过计算机实现这一功能时,就形成了数据融合技术。

数据融合就是充分利用多传感器资源,通过对这些多传感器及观测信息的合理支配和使用,把多传感器在空间或时间上的冗余或互补信息依据某些准则进行组合,以获得被测对象的一致性解释或描述。数据融合的内容主要包括:

(1)数据关联。确定来自多传感器的数据反映的是否是同源目标。

(2)多传感器ID/轨迹估计。假设多传感器的报告反映的是同源目标,对这些数据进行综合,改进对该目标的估计,或对整个当前或未来情况的估计。

(3)采集管理。给定传感器环境的一种认识状态,通过分配多个信息捕获和处理源,最大限度地发挥其性能,从而使其操作成本降到最低。传感器的数据融合功能主要包括多传感器的目标探测、数据关联、跟踪与识别、情况评估和预测。

根据融合系统所处理的信息层次,目前常将信息融合系统划分为3个层次:

(l)数据层融合。直接将各传感器的原始数据进行关联后,送入融合中心,完成对被测对象的综合评价。其优点是保持了尽可能多的原始信号信息,但是该种融合处理的信息量大、速度慢、实时性差,通常只用于数据之间配准精度较高的图像处理。

(2)特征层融合。从原始数据中提取特征,进行数据关联和归一化等处理后,送入融合中心进行分析与综合,完成对被测对象的综合评价。这种融合既保留了足够数量的原始信息,又实现了一定的数据压缩,有利于实时处理,而且由于在特征提取方面有许多成果可以借鉴,所以特征层融合是目前应用较多的一种技术。但是该技术在复杂环境中的稳健性和系统的容错性与可靠性有待进一步改善。

(3)决策层融合。首先每一传感器分别独立地完成特征提取和决策等任务,然后进行关联,再送入融合中心处理。这种方法的实质是根据一定的准则和每个决策的可信度做出最优的决策。其优点是数据通讯量小、实时性好,可以处理非同步信息,能有效地融合不同类型的信息。而且在一个或几个传感器失效时,系统仍能继续工作,具有良好的容错性,系统可靠性高,因此是目前信息融合研究的一个热点。但是这种技术也有不足,如原始信息的损失、被测对象的时变特征、先验知识的获取困难,以及知识库的巨量特性等。

1.3处理模型

美国数据融合工作小组提出的数据融合处理模型,当时仅应用于军事方面,但该模型对人们理解数据融合的基本概念有重要意义。模型每个模块的基本功能如下:

数据源。包括传感器及其相关数据(数据库和人的先验知识等)。

源数据预处理。进行数据的预筛选和数据分配,以减轻融合中心的计算负担,有时需要为融合中心提供最重要的数据。目标评估。融合目标的位置、速度、身份等参数,以达到对这些参数的精确表达。主要包括数据配准、跟踪和数据关联、辨识。

态势评估。根据当前的环境推断出检测目标与事件之间的关系,以判断检测目标的意图。威胁评估。结合当前的态势判断对方的威胁程度和敌我双方的攻击能力等,这一过程应同时考虑当前的政治环境和对敌策略等因素,所以较为困难。

处理过程评估。监视系统的性能,辨识改善性能所需的数据,进行传感器资源的合理配置。人机接口。提供人与计算机间的交互功能,如人工操作员的指导和评价、多媒体功能等。

二、多传感器在林业中的应用

2.1在森林防火中的应用

在用MODIS(ModerateResolutionImagingSpectroradiometer)数据测定森林火点时的20、22、23波段的传感器辐射值已达饱和状态,用一般图像增强处理方法探测燃烧区火点的结果不理想。余启刚运用数据融合技术,在空间分辨率为1000m的热辐射通道的数据外加入空间分辨率为250m的可见光通道的数据,较好地进行了不同空间分辨率信息的数据融合,大大提高了对火点位置的判断准确度。为进一步提高卫星光谱图像数据分析的准确性与可靠性,利用原有森林防火用的林区红外探测器网,将其与卫星光谱图像数据融合,可以使计算机获得GPS接收机输出的有关信息通过与RS实现高效互补性融合,从而弥补卫星图谱不理想的缺失区数据信息,大大提高燃烧区火点信息准确度和敏感性。

2.2森林蓄积特征的估计

HampusHolmstrom等在瑞典南部的试验区将SPOT-4×S卫星数据和CARABAS-IIVHFSAR传感器的雷达数据进行了融合,采用KNN(knearestneighbor)方法对森林的蓄积特征(林分蓄积、树种组成与年龄)进行了估计。

KNN方法就是采用目标样地邻近k个(k=10)最近样地的加权来估计目标样地的森林特征。研究者应用卫星光谱数据、雷达数据融合技术对试验区的不同林分的蓄积特征进行估计,并对三种不同的数据方法进行误差分析。试验表明,融合后的数据作出的估计比单一的卫星数据或雷达数据的精度高且稳定性好。

2.3用非垂直航空摄像数据融合GIS信息更新调查数据

森林资源调查是掌握森林资源现状与变化的调查方法,一般以地面调查的方法为主,我国5年复查一次。由于森林资源调查的工作量巨大,且要花费大量的人力、物力和资金。国内外许多学者都在探索航空、航天的遥感调查与估计方法。

TrevorJDavis等2002年提出采用非垂直的航空摄影数据融合对应的GIS数据信息实现森林调查数据的快速更新,认为对森林资源整体而言,仅某些特殊地区的资源数据需要更新。在直升飞机侧面装上可视的数字摄像装置,利用GPS对测点进行定位,对特殊地区的摄像进行拍摄,同时与对应的GIS数据进行融合,做出资源变化的估计或影像的修正。

试验表明,融合后的数据可以同高分辨率矫正图像相比,该方法花费少,精度高,能充分利用影像的可视性,应用于偏远、地形复杂、不易操作、成本高的区域,同时可避免遥感图像受云层遮盖。

三、数据融合在林业中的应用展望

3.1在木材检测中的应用

3.1.1木材缺陷及其影响

木材是天然生长的有机体,生长过程中不可避免地有尖削度、弯曲度、节子等生长缺陷,这些缺陷极大地影响了木材及其制品的优良特性,以及木材的使用率、强度、外观质量,并限制了其应用领域。在传统木制品生产过程中,主要依靠人的肉眼来识别木材缺陷,而木材板材表面缺陷在大小、形状和色泽上都有较大的差异,且受木材纹理的影响,识别起来非常困难,劳动强度大,效率低,同时由于熟练程度、标准掌握等人为因素,可能造成较大的误差。另外在集成材加工中,板材缺陷的非双面识别严重影响了生产线的生产节拍。因此必须开发一种能够对板材双面缺陷进行在线识别和自动剔除技术,以解决集成材加工中节子人工识别误差大、难以实现双面识别、剔除机械调整时间长等问题。

3.1.2单一传感器在木材检测中的应用

对木材及人造板进行无损检测的方法很多,如超声波、微波、射线、机械应力、震动、冲击应力波、快速傅立叶变换分析等检测方法。超声技术在木材工业中的应用研究主要集中在研究声波与木材种类、木材结构和性能之间的关系、木材结构及缺陷分析、胶的固化过程分析等。

随着计算机视觉技术的发展,人们也将视觉传感器应用于木材检测中。新西兰科学家用视频传感器研究和测量了纸浆中的纤维横切面的宽度、厚度、壁面积、壁厚度、腔比率、壁比率等,同时准确地测量单个纤维和全部纤维的几何尺寸及其变化趋势,能够区分不同纸浆类型,测定木材纤维材料加固结合力,并动态地观察木材纤维在材料中的结合机理。

新西兰的基于视觉传感器的板材缺陷识别的软件已经产业化,该软件利用数码相机或激光扫描仪采集板材的图像,自动识别板材节子和缺陷的位置,控制板材的加工。该软件还具有进行原木三维模型真实再现的计算机视觉识别功能,利用激光扫描仪自动采集原木的三维几何数据。

美国林产品实验室利用计算机视觉技术对木材刨花的尺寸大小进行分级,确定各种刨花在板中的比例和刨花的排列方向;日本京都大学基于视觉传感器进行了定向刨花板内刨花定向程度的检测,从而可以通过调整定向铺装设备优化刨花的排列方向来提高定向刨花板的强度。在制材加工过程中,利用计算机视觉技术在线实时检测原木的形状及尺寸,选择最佳下锯方法,提高原木的出材率。同时可对锯材的质量进行分级,实现木材的优化使用;在胶合板的生产过程中,利用计算机视觉技术在线实时检测单板上的各种缺陷,实现单板的智能和自动剪切,并可测量在剪切过程中的单板破损率,对单板进行分等分级,实现自动化生产过程。Wengert等在综合了大量的板材分类经验的基础上,建立了板材分级分类的计算机视觉专家系统。在国内这方面的研究较少,王金满等用计算机视觉技术对刨花板施胶效果进行了定量分析。

X射线对木材及木质复合材料的性能检测已得到了广泛的应用,目前该技术主要应用于对木材密度、含水率、纤维素相对结晶度和结晶区大小、纤维的化学结构和性质等进行检测,并对木材内部的各种缺陷进行检测。

3.1.3数据融合在木材检测中的应用展望

单一传感器在木材工业中已得到了一定程度的应用,但各种单项技术在应用上存在一定的局限性。如视觉传感器不能检测到有些与木材具有相同颜色的节子,有时会把木板上的脏物或油脂当成节子,造成误判,有时也会受到木材的种类或粗糙度和湿度的影响,此外,这种技术只能检测部分表面缺陷,而无法检测到内部缺陷;超声、微波、核磁共振和X射线技术均能测量密度及内部特征,但是它们不能测定木材的颜色和瑕疵,因为这些缺陷的密度往往同木板相同。因此,一个理想的检测系统应该集成各种传感技术,才能准确、可靠地检测到木材的缺陷。

基于多传感器(机器视觉及X射线等)数据融合技术的木材及木制品表面缺陷检测,可以集成多个传统单项技术,更可靠、准确地实时检测出木材表面的各种缺陷,为实现木材分级自动化、智能化奠定基础,同时为集裁除锯、自动调整、自动裁除节子等为一身的新型视频识别集成材双面节子数控自动剔除成套设备提供技术支持。

3.2在精确林业中的应用

美国华盛顿大学研究人员开展了树形自动分析、林业作业规划等研究工作;Auburn大学的生物系统工程系和USDA南方林业实验站与有关公司合作开展用GPS和其他传感器研究林业机器系统的性能和生产效率。

目前单项的GPS、RS、GIS正从“自动化孤岛”形式应用于林业生产向集成技术转变。林业生产系统作为一个多组分的复杂系统,是由能量流动、物质循环、信息流动所推动的具有一定的结构和功能的复合体,各组分间的关系和结合方式影响系统整体的结构和功能。因此应该在计算机集成系统框架下,有效地融合GPS、GIS、RS等数据,解决这些信息在空间和时间上的质的差异及空间数据类型的多样性,如地理统计数据、栅格数据、点数据等。利用智能DSS(决策支持系统)以及VRT(可变量技术)等,使林业生产成为一个高效、柔性和开放的体系,从而实现林业生产的标准化、规范化、开放性,建立基于信息流融合的精确林业系统。

南京林业大学提出了“精确林业工程系统”。研究包括精确林业工程系统的领域体系结构、随时空变化的数据采集处理与融合技术、精确控制林业生产的智能决策支持系统、可变量控制技术等,实现基于自然界生物及其所赖以生存的环境资源的时空变异性的客观现实,以最小资源投入、最小环境危害和最大产出效益为目标,建立关于林业管理系统战略思想的精确林业微观管理系统。

[参考文献]

[1]高翔,王勇.数据融合技术综述[J].计算机控制与测量,2002,10(11):706-709.

[2]龚元明,萧德云,王俊杰.多传感器数据融合技术(上)[J].冶金自动化,2002(4):4-7.

[3]钱永兰,杨邦杰,雷廷武.数据融合及其在农情遥感监测中的应用与展望[J].农业工程学报,2004,20(4):286-290.

[4]高德平,黄雪梅.多传感器和数据融合(一)[J].红外与激光工程,1999,28(1):1-4.

数据分析的前景第3篇

【关键词】Mc接口 运营商 大数据 旅游行业

1 引言

随着互联网公司的迅速崛起,传统电信运营商正面临着巨大冲击,原有的价值链被打破,逐步沦为“哑管道”,运营商陷入了前所未有的困境,必须寻找新的业务增长点。

当前社会对数字化生活的依赖度不断提高,移动娱乐、移动医疗、移动教育、移动金融及物联网、云计算、大数据等数字化服务需求旺盛,将成为新一轮的消费热点。因此运营商开始研究以网格区域内人群位置数据为核心、用户数据为辅助的大数据基础能力研究,实现网格覆盖区域内的流量监控分析、人口特征洞察、位置轨迹分析、综合价值评估等基础功能,并支持通过组合、复用等方式,支撑旅游、交通、金融、咨询服务等行业应用。运营商处在大数据业务的中心位置,在掌握用户行为方面具有得天独厚的先发优势。基于此,本文接下来将对运营商大数据在旅游行业的应用进行探索研究,总结其拥有的优势以及具体的应用场景。

2 运营商大数据在行业信息化的优势

与互联网公司相比,运营商手中的数据更具有普遍性,甚至几乎囊括了所有的社会个体,尤其是运营商针对社会人群的精准数据,更是一座现成的金矿。目前运营商要做的事情并非“发展客户增加收入的阶段”,而是将客户的精准数据分析、位置数据和用户规模结合起来,再利用大数据技术服务于运营商的转型业务,用于自身业务的精确营销、交通部门的道路规划、商圈的选址及旅游行业,突破原先业务的束缚,在大数据运营的蓝海里寻找一片新的天地。

运营商的大数据来源:

(1)用户资料:这些是用户的个人隐私数据,有些信息可以用于用户趋势性数据分析(用户区域信息),主要包括如下主要信息:用户的归属信息(用户的归属省份信息、地市信息、县市信息)、性别信息(男/女)、年龄、单位性质等信息,这些数据只使用于趋势性分析、地域分析,不能用于个性用户的数据分析。

(2)用户的订购关系数据:用户在运营商订购的业务、套餐信息。

(3)用户行为分析数据:用户的上网行为分析数据、用户的消费信息(通话的通话清单、短信清单、流量消费信息),这些数据是用户的敏感隐私数据,在使用时必须进行脱敏处理。

(4)用户的位置信息:用户在HLR(Home Location Register,归属位置寄存器)登记的位置信息、基于A接口或Mc接口的位置更新信息(Location Update)、漫游切换信息、位置附着信息(Attach)、MT、Mo过程信息及SMS短信过程信息,这些数据都是实时数据,准确地记录了用户行驶轨迹,准确性非常高。

运营商的大数据在旅游行业的优势:

(1)数据准确性

工信部、公安部、国家工商总局联合发文,从2015年1月1日起,所有运营商注册的用户必须实行实名登记,这样确保了用户基础数据的准确可靠。其中位置信息、互联网访问信息都记录了用户实际到访位置及上网行为,再结合用户属性数据、订购业务、详单信息等,和客户的行为、喜好直接相关,有很高的准确性。

(2)权威性

移动运营商的用户规模大,约占70%的市场份额的移动数据更具有权威性,采样数据比较全面,在趋势性分析领域更具权威性。通过用户的行为数据的采集和分析,结合企业数据中心用户行为特征,为集团客户提供精确营销开辟了新途径,为今后的大数据分析提供数据分析源。用户所有在互联网络的操作行为、到访信息,运营商都可以记录,并经数据脱敏,就可以为旅游、交通、政府的业务规模提供趋势性分析数据。

(3)实时性

移动运营商拥有丰富的网络信令数据,用户发生位置移动、发送短信、上网等操作都会在网络的Mc接口(4G网络)或A接口(传统的2G网络)触发信令数据产生。通过这些信令数据的上下文,可以通过基站描点勾勒出用户的活动轨迹,而且这些数据都是实时的,和用户的实际过程相匹配。

除此之外,还有用户的主动位置更新(更新LAI)和定期的位置更新(一般为2小时以内),也会记录用户的位置信息,再利用运营商在旅游景区的基站信息同景区进行有效的结合。

实时客流监控、景区客流分析、游客特征分析就是利用运营商在旅游景区的基站信息,利用实时采集A接口、Mc接口数据的信令数据,实时分析景区的用户轨迹数据,对景区客流信息实行实时监控分析,改变景区只能事后统计用户量的情况,提升实时反映能力,进而加强服务和管控能力,并为推动旅游业信息化发展提供有效信息数据支撑。

3 运营商大数据在旅游行业的应用分析

以游客为中心,服务游客,满足游客需求,运营商可获取相关静态数据:游客人群来源地(用户的归属信息)、性别;再结合用户的动态信息:位置信息、来访时间、在各景点的驻留时间,进行旅游客源分析统计,并对景区客流信息进行实时监控与分析,将有效提升景区的服务与响应能力,为景区应急调度与管理提供依据。同时,如图2所示,通过对游客客源归属地的分析统计及对客户行为、特征的全面分析,为景区信息化建设及市场推广提供有效的数据支撑。

(1)客流分析

通过对景区包含的基站信令接口数据分析,统计出基站当前实时人数,同时参考运营商用户占比模型,计算当前景区(或景区内某一区域)的实际游客数量,实时反馈给景区系统,以趋势图或数字方式呈现。

根据提供景区人流量及归属地的实时统计与分析数据,再结合用户的归属信息,分析出各省市的游客旅游热度分析、游客特征分析、游客驻留时长分析、历史客流比对分析(按周、按月等)、重点节假日游客分析,支持实时客流量GIS地图展示,支持各类分析数据的报表展示。

基于网格管理实现景区网格的人流量可视化,实现实时监控预警、分析预测、深度洞察、信息,为旅游行业在流量情况掌握、应急预案准备、公众信息等方面提供参考和支撑。根据景区的容纳游客人数,同景区实时游客进行比较,达到上限时进行告警,提高景区管理职能和服务能力,及安全保障措施。

客流统计分析如表1所示:

(2)客源特征分析

根据客流分析的用户数据,再根据运营商的用户归属信息,把手机网络信令数据和用户数据结合,为旅游景区提供游客特征分析、游客消费分析、游客精确营销分析,满足景区的游客洞察与营销需求,改善景区管理水平。

通过实时数据采集分析到访景区的当前用户构成,细分到省、地市、县市,并可以按照用户数访问的时段进行归属信息统计,将景区内游客显示在电子地图上,同时对区域进行流量监控。

基于用户的归属信息,根据入园游客年龄分布统计、入园游客性别分布统计、入园游客到访频次统计、游客对景点类型的喜好度、入园游客的消费能力分析以及客户运营商产品订购行为的分析,进行360°游客画像,建立客户的归属地、年龄分布、性别比例、喜好景点类型、消费档次分布数据的分析,根据分析结果进行精准匹配。在用户到达相关景区时,实时推送景点相关信息,在推送渠道、推送时机、推送方式上满足客户的个性化需求,实现全程精准营销。图3为客源特征分析图。

(3)景区欢迎度分析

在了解游客归属地情况下,可以进一步统计各个省市用户到达旅游景区的热度排名,再分别通过当天、周、月、季、年的方式展现各个旅游景区人数排名、分时段人数排名,并提供景区热度排行,包括日排行、周排行、月排行以及节假日的特殊统计分析;确定城市中哪些景区为热门景区,为管理部门制定预案或者提升景区服务能力提供参考;提供外地游客来城市首先访问的景点,或者景点访问顺序,提供给旅游服务企业或者旅游监管部门有关景点的分析,或者访问路径优化等。

提供按时间段(最小统计单位天)景区内各个景点的用户滞留时长数据,时间段可以灵活设定。热点分析包括:热点客流分析、热点客源分析、热点景点分析,通过对客流来源、热点时期每天客流统计以及热点时间段内客源在景区内各个景点的分布情况综合分析,使得景区管理员更充分地了解到热点时期游客游玩景区的行为习惯和分布比例,为景区实施营销策划和资源调配提供有力数据保障。

(4)客流趋势分析、历史对比分析

根据往年的历史数据,可以从横向和纵向时间的维度对流量数据进行分析统计,方便景区管理员掌握景区各维度客流情况。通过对热点景区的专题分析,可通过对节假日的分析了解游客在不同节假日的来源、流量高峰及喜好等特征,进行相关时间段的游客趋势分析,为景区经营决策提供数据支撑,为节假日景区游客提前进行疏导准备工作。

如图4所示,景区内各景点区域实时游客人数地图显示,人员密度根据游客舒适度情况进行颜色标注,在系统顶部以消息滚动条形式实时播报景区内游客总量和拥挤及较拥挤的区域信息。同时手机客户端将推送拥堵信息给景区管理员,提醒景区管理人员做好游客疏导工作。

(5)旅游行业后向广告

结合用户的归属信息、到达景区的时间、在景区的滞留时间,整合旅游景点商家信息,基于游客群体的特征分析,提供后向广告功能,为旅游景点、城市旅游宣传、旅行社热点宣传提供专业的移动渠道广告业务。如用户旅游结束后,在景点出口出可以实时给游客推荐附近的以下信息:

1)住宿设施:酒店、旅店、招待所、家庭旅馆等);服务性设施:餐饮场所、娱乐场所、购物场所、商店;

2)旅游交通线路:高速公路休息站、城市所有的公交站点、长途汽车站点、机场、火车站、交通售票点(航空、铁路)、城市旅游咨询服务中心、租车公司、旅游线路、景区内的通行车线路等;

3)辅助设施:公共厕所、公共停车场、加油加汽站、收费站、车辆维修点;

4)商铺信息:景点的特色服务信息、商家的促销信息可以结合用户的位置信息实时发送到达景点的游客。

4 结束语

以移动用户的位置信息、用户数据信息为纽带,通过移动大数据的建设,可构建旅游行业新型产业价值链,提升旅游经济附加值。因此,本文对运营商大数据在旅游行业的应用进行了研究,首先分析了运营商大数据在行业信息化所拥有的优势,随后通过客流分析、客源特征分析、景区欢迎度分析、客流趋势分析、历史对比分析及旅游行业后向广告等多个方面探讨运营商大数据在旅游行业的应用,为景区信息化建设及市场推广提供数据支撑。

总而言之,对于旅游行业,通过信息化手段,结合用户的位置信息大数据分析,将分散在各地的单个景点按其文化内涵,串“点”成“线”,强化重点景点、文化和游客的有机统一,可提升旅游行业的整体文化附加值,提高旅游行业档次,促进行业转型升级,通过建立和健全“智慧旅游”综合信息服务系统,提升了旅游监管部门的经营管理能力,为运营商的业务转型提供了新的业务探索。

参考文献:

[1] 谢廷晟,牛化成,刘美英. HTML5权威指南[M]. 北京: 人民邮电出版社, 2015.

[2] 位元文化. JSP动态网页入门实务[M]. 北京: 科学出版社, 2001.

[3] 林星. HTML5移动应用开发[M]. 北京: 人民邮电出版社, 2013.

[4] 王易,蓝尧. 微信这么玩才赚钱[M]. 北京: 机械工业出版社, 2014.

[5] 中国移动通信集团江苏有限公司. 南京智慧旅游客源分析系统技术方案[Z]. 2014.

[6] 中国移动通信集团江苏有限公司. 打造掌厅主入口 促进互联网化营销转型的探索与实践[Z]. 2015.

[7] 中国移动通信集团江苏有限公司. 江苏公司集团市场入口布局汇报[Z]. 2015.

[8] 程德杰. 电信运营商真正的优势在于大数据分析[J]. 移动通信, 2013(17): 76-77.

[9] 陈科帆,周洪成. 电信运营商大数据资源变现模式及策略研究[J]. 移动通信, 2016(1): 63-67.

[10] 朱健,王雄,李光文. TD-LTE室内分布系统四网协同组网方案研究[J]. 通信与信息技术, 2014(6): 65-67.

数据分析的前景第4篇

“数字地球”是空间信息技术发展中的重要概念。“数字地球”的构想是美国副总统戈尔于1998年提出的,其实质是网络基础设施、数据库与计算机构成的数字化地理虚拟系统,目的是使人们能够通过数字化信息网络,自由地链接、调用地理信息。“数字地球”的核心是3S集成技术。3S包括GPS、RS和GIS。GPS即全球定位系统,可通过坐标系统进行全天候精确定位、定性和定时,在导航、测绘、军事、农业、考古等方面的应用前景广阔。RS即遥感技术,各类卫星遥感能够全天候对地表实时监测,深入、准确地监测地表景观的状态。GIS即地理信息系统,是各类空间数据与属性数据的集成数据库平台,能够进行各类空间分析、演变分析与三维成像。GIS、RS与GPS所采用的数据格式具有共通性,能够达到无缝连接,极大地拓展了风景园林中分析、规划与设计的一体化能力。

二、空间信息技术促进风景园林专业技能变革

空间信息技术的发展能够大幅促进我国风景园林专业技能的变革。主要的变化包括空间数据、景观的监测与分析、工作效率化方面。风景园林研究、规划和设计均涉及各类空间数据。对于规划设计人员来说,获取、处理有效的数据是重要的专业技能。针对基础数据内容庞杂、种类繁多且尺度不一的特点,我国已经着手建设地图数据库、测绘档案等数据基础设施。各类商业遥感影像也是重要的数据源,可以根据用户要求有针对性的调取。规划设计人员能够在GIS平台上,对空间数据进行分析,从而准确地掌握基地的地表状况,提高规划设计方案的合理性。风景园林从业人员可以利用遥感技术对地貌景观进行广域、实时、高精度的监测,并通过GIS进行定量化分析;通过RS和GIS技术,规划师可以定量地掌握绿地植被分布状态,在GIS中可以进行时间序列演变分析、土地适宜性评价、热岛分析、空间分析(包括网络分析、可达性分析、叠加分析等)、景观指数分析等,为绿地规划、城乡与区域规划提供基本的依据。引入数字技术能够大幅提高工作效率。空间数字信息技术,尤其是3S集成技术的不断发展与完善,促进了数据与软件的无缝兼容,推动了园林设计的自动化进程。设计自动化包括办公流程自动化、数据采集自动化、输入输出自动化、分析自动化和管理自动化。办公电子设备与软件集成化发展提高了数据传输与处理的效率,国家大力推动的数据标准化与共享化也有力提升了规划设计人员采集、分析和处理数据的能力。

三、高校风景园林专业空间信息技术教学的目的

(一)加强对空间数据的理解

风景园林专业的规划设计课程涉及到空间数据的处理。空间信息技术教学实际上是围绕空间数据的获取、处理、分析而展开的。目前学生普遍缺乏对空间数据的理解,对于空间数据的基本属性、数据的格式与转换、数据的来源缺少科学的认知。空间信息技术教学可以使学生深入掌握各类空间数据的特征、理解数据的含义和表达、了解数据的来源途径和获取方法,熟练运用不同的空间数据格式转换技能,为识别有效数据、处理数据奠定基础。

(二)掌握空间数据的获取能力

空间数据来源广泛、质量混杂,初学者往往难以理清数据的来源渠道。比如有学生在课题中利用遥感图像进行绿化地解析,所采用的数据为网络下载的栅格数据,这类数据失真性较大,并不能用于绿地定量研究。出现这种错误的根本原因在于学生没有了解有效数据的获取途径。教学中应使学生了解国际、国家和省市等相关机构和商业公司的各类空间数据范围及其特性,以及这些数据对于风景园林专业的用途,使学生具有识别有效数据,掌握有效数据获取途径的能力。

(三)掌握基本的空间分析方法

深入、正确的空间分析是获得合理的规划设计方案的前提,也是对规划设计方案进行调整的基础。因此,应使园林专业学生了解、掌握利用GIS软件处理空间数据和进行空间分析的方法。GIS平台中的空间分析模块包括叠加分析、缓冲区分析、可达性分析、距离分析、表面分析、计量统计等功能,可进行时间序列演变与空间格局的量化分析,也可以利用统计结果进行各类景观指数的演算,并制作相应的主题图,作为规划设计的依据。

(四)掌握数据库能力

数据库是对各类工作数据的管理平台。对于景观规划、园林遗产保护、园林植物与应用方向的学生来说,需要收集、管理各类园林资源、植物和地理空间数据。而现实状况中,这些数据往往数量庞大、来源复杂、格式多样,如何管理好这些数据成为影响工作结果的重要因素之一。数据库是解决这个问题的重要方法。空间信息技术教学应使学生获得数据库构建技能,进一步提升其管理数据、使用数据的能力与效率,对其将来的工作具有很好的促进作用。

四、高校风景园林专业空间信息技术课程设置

风景园林专业是应用性较强的专业,与社会实际需求结合紧密。而空间信息技术本身是系统性的科学,因此需要以风景园林专业特点为中心进行知识点提炼,建立有针对性和系统性的教学体系。风景园林专业课程包括理论与设计两大类型,成系列的规划设计课程为教学体系的中心,相关理论知识点是围绕提高学生规划设计能力这个目标来设置的。因此,空间信息技术课程也应以园林规划设计为中心,设置相应的教学内容,通过培养学生空间数据处理技能达到提高规划设计能力的目的。一般来说,高校园林专业所设置的园林规划设计系列课程包括园林设计与园林规划两大内容。园林设计是针对中小尺度的场地,包括庭园设计、专类公园设计、综合公园设计、广场设计、居住区绿地设计、街旁绿地设计、带状公园设计等课程,园林规划是在大尺度的场地上实施的绿地系统规划、风景区规划、度假区景观规划、滨水区景观规划等。设计的尺度越大,与城市、社区以及自然环境的关系越复杂,就越需要学生具备较好的数据收集和处理能力,并能够掌握、应用一定的空间分析方法。笔者认为,针对园林专业课程内容和技能要求,可将空间信息技术教学内容划分为三个模块,每个模块有不同的教学内容与目的,且与相应的园林教学课程相对应。三个模块包括基础模块、数据处理模块和空间分析模块,基础模块是理论教学,数据处理与空间分析模块是实践教学。基础模块以学生认知空间数据为基本目的,主要包括空间数据的格式与分类、空间数据的作用与意义、地理坐标系统与地图学基本知识、3S技术原理、数据库基础、数据基础设施与常用空间数据源等教学内容。数据处理模块与园林设计课程相对应,以学生在设计过程中能够正确获取、处理基地环境数据为目的,教学内容包括DEM高程数据处理、GPS数据获取与转换、CAD文件格式转换、RS地物分析等。空间分析模块与园林规划课程相对应,以学生在规划过程中能够进行科学地空间分析为根本目的,主要教学内容包括叠加分析、缓冲区分析、可达性分析、距离分析等,并使学生能够制作主题图,作为规划的依据。基础模块、数据处理与空间分析三个模块教学内容应依次进行,只有掌握前一个模块内容,方能进行下一个模块的教学。基础模块必须开设独立的课程,数据处理与空间分析模块既可以是独立的课程,也可以作为园林设计课程中的组成单元,或者采用连续性的讲座形式。

五、难点与展望

数据分析的前景第5篇

关键词:土地利用;景观格局;前郭

中图分类号: F301.24 文献标识码: A 文章编号: 1674-0432(2013)-14-06-2

景观生态学是地理学与生态学之间的一门新兴的交叉学科,主要研究景观空间格局、生态过程、景观生态规划与设计[1]。景观生态学与可持续发展概念具有高度的一致性,是实现土地资源可持续利用的一条重要途径[2]。近年来,景观生态学理论和方法的应用范围越来越广,包括在城乡土地利用规划、森林和牧场经营管理、环境和自然保护、旅游设计等方面[3]。本文采用目前相对成熟的景观格局指数对前郭尔罗斯蒙古族自治县(简称前郭县)土地利用结构进行分析,以期为前郭县土地资源的可持续利用提供科学依据。

1 研究区概况

前郭县地处松辽平原的东端、松嫩沙地的边缘,属半湿润半干旱过渡区,是我国环境演化的一级敏感地带。在地质构造上处于第三纪东北陆台的中心部分,地层以第四纪沉积物为主。全县地势南、西部高,北、东、中部低,呈马鞍状,第二松花江、嫩江分别流经该县的东部和北部。前郭县地貌类型复杂,包括沿江泛滥平原、冲积湖积平原、古河道洼地、阶地平原、高台地和沙垄与丘间洼地。该县地带性土壤为黑钙土,自然植被为草甸草原。前郭县是以农为主,农牧并举的县份,随着农作物布局的不断调整,水稻种植面积不断增加。

2 数据来源及研究方法

2.1 数据来源

以2009年土地利用类型图及其他相关文献资料等作为基本数据源,并结合目前国际上流行的景观空间格局分析软件包Patch Analyst对各景观指数进行分析研究。为能综合反映其整体土地利用景观格局,本研究按照国家土地分类标准,将研究区景观类型分为耕地、园地、林地、草地、交通运输用地、水域、沟渠、城市、建制镇、村庄、采矿用地、风景名胜特殊用地、未利用地等13个类型。

2.2 研究方法

相关景观指标的计算主要采用景观生态学一些常用的方法,主要采用的空间格局指数名称、计算公式和说明见表1。在 ArcGIS 环境下获取需要分析的地物类型的矢量数据作为实验数据,并结合Patch Analyst 5 空间格局分析模块,对各类景观指数进行分析研究(表2)。

3 结果与分析

3.1 景观斑块数量及面积特征

如表2所示,在斑块数量上,各景观类型依次为:林地>耕地>采矿用地>草地>村庄>水域>未利用地>园地>交通用地>沟渠>风景名胜特殊用地>建制镇>城市。在景观面积上,各景观类型面积大小依次为耕地>草地>林地>水域>未利用地>村庄>沟渠>交通用地>采矿用地>建制镇>风景名胜特殊用地>城市。耕地、草地、林地面积较大,形成了以农用地为主的景观结构。另外,村庄用地景观类型在整个区域中也占有一定比重。水域景观主要是县域内密集分布的河泡,其中包括面积达500平方公里的查干湖。

3.2 景观斑块密度及差异特征

从斑块密度上看,从高到低依次为采矿用地>风景名胜特殊用地>园地>交通用地>村庄>林地>城市>建制镇>未利用地>沟渠>草地>水域>耕地。采矿用地斑块密度远远高于其他景观斑块,采矿用地主要是由于原油开采密集分布,由于本次分析采用的是1∶1万土地利用图,这些小面积的斑块在第二次土地调查中均归类为采矿用地,使得这一景观斑块密度最大。在利用矢量数据分析景观格局特征时,相邻同类型斑块在分析时要进行合并,耕地景观斑块密度最小,这与前郭县耕地多已连片有关。从平均面积上看,各景观类型的大小顺序与斑块密度正好相反,耕地景观平均斑块面积最大,采矿用地平均斑块面积最小。从斑块面积标准差上看,前郭县的土地利用景观面积差异性较大,斑块面积变异系数对比明显。

3.3 景观多样性、均匀度特征

多样性指数是基于信息论基础之上,用来度量系统结构组成复杂程度的一些指数。从各景观Shannon多样性指数上看,各景观从高到低依次为采矿用地>村庄>林地>耕地>园地>草地>未利用地>风景名胜特殊用地>交通用地>城市>建制镇>沟渠>>水域。耕地(水田、旱地)作为占前郭县面积最大的人工干扰景观,其单一的多样性不利于总体景观的生态平衡,反而增加了景观的干扰性和不稳定性,必然也降低景观的自我调节能力。从Shannon均匀度指数上看,高到低依次为城市>园地>村庄>采矿用地>风景名胜特殊用地>耕地>林地>建制镇>未利用地>交通用地>草地>沟渠>水域。除了水域、沟渠外,其他景观均呈现较高的斑块分布均匀性。

4 结语

由以上分析可以看出,前郭县土地利用景观格局具有以下特点:(1)土地利用景观的主体是耕地,其次为草地和林地,城乡建设用地则分布较为分散,其格局与耕地的分布格局密切相关。(2)前郭县整体景观多样性较低,景观分布均匀性较强,东部景观类型较单一。国土等相关部门,在进行土地利用规划时,应根据自然地理条件、社会经济发展条件以及土地利用中存在的问题,合理制定相关政策,采取有效措施,保护好现有的土地资源。

参考文献

[1] 赵中华,李春林,郄瑞卿,李清华.基于景观生态学的土地利用景观格局特征分析[J].以磐石市为例,2012,40(8):4658-4702.

数据分析的前景第6篇

关键词:寿险市场 景气指数 合成指数 时差相关分析 预警

19世纪末期,经济景气研究在国外开始兴起。经过一百多年发展,越来越完善的景气分析方法已经被各国政府广泛使用,并且取得了十分显著的成效。针对国内的一些行业领域,如工业、房地产、旅游业等,近年来已有较多研究,但对于我国的寿险业,甚至保险业,景气分析几乎还是一个全新的课题。本文将景气指数运用于寿险市场研究,根据我国2000~2011年寿险市场的指标数据,构建我国寿险市场景气指数体系,从定量方面预测寿险市场发展趋势,填补了景气分析应用于这一领域的空白,为政府宏观调控和整个行业的发展提供了科学依据,也为寿险公司的经营决策者提供一定的借鉴和参考。

一、寿险市场景气指数指标的选定

(一)指标的组成内容

本文从寿险业务量、寿险市场规模、寿险在国民经济中的地位、寿险企业效益四个方面来反映寿险市场的景气状况(参见表1)。

上述指标之间存在一定的相关性,这会造成数据信息的重复使用,影响结果的合理性与科学性,因此剔除相关性较高的指标,最终选择寿险保费收入、寿险给付金额、寿险公司数、寿险公司总资产、寿险从业人员数、寿险保险密度、寿险保险深度、寿险公司预计利润总额、寿险机构资金运用率、寿险机构资金运用盈利率等10个具有代表性的指标来构建寿险市场景气指数。

(二)指标数据的标准化

(三)先行、一致、滞后指标的选定

二、寿险市场景气指数的编制与实证分析

(二)合成指数的实证分析

根据上述合成指数编制方法,指定2000年为基准年份,可计算出寿险市场一致景气指数,进而得出景气指数波动率,绘制寿险市场景气指数与波动情况合成图(图1)如下。

从实证结果来看,2001年我国寿险市场景气指数处于增长状态,增长率为1.04%。然而,2002年,景气指数并没有一路攀升,而是出现了下滑趋势,并在2005年达到谷底,景气指数下滑到97.64,寿险市场首次出现微弱不景气现象。随后,景气指数开始出现回升态势,从2006年开始快速攀升,经过4年时间在2010年到达峰点并进入平稳发展时期。我国寿险市场总体处于微景气状态,景气指数波动幅度较小。

2000年之前,我国寿险市场一直以传统寿险产品为主,产品重点突出保障功能,基本不具有储蓄和投资功能。2000 年之后,随着分红险、万能险和投连险等新型产品的推出,结构发生了重大变化的寿险市场则以兼具保障、储蓄、投资功能为一体的新型产品为主。2001年,随着中国加入WTO,保险市场进一步开放,大量外资寿险公司进入中国市场,本土中小保险企业也迅速发展壮大。因此,景气指数达到101.04,增长率为1.04%,寿险市场相对景气。但是好景不长,由于中国保险市场待开发前景和利润潜力相当可观,自身的保险经验又相对不足,承保能力有限,呈现出供求极不平衡的态势;而发达国家保险市场供给却相对过剩,需寻找新的市场,二者之间的明显“落差”,市场上期的高增长和超额利润吸引了投资者一哄而上,造成了欧美的保险人纷纷抢滩中国的热潮,无序发展使得市场出现了非理性状态,2002年景气指数开始出现下滑趋势。但是在低利率环境下,寿险市场不断推出新型产品,并开创了银行这一新渠道,一直到2004年,景气指数虽然不断下滑,却一直处于100以上,下滑幅度并不明显,寿险市场仍然处于微景气状态。

2005年景气指数达到谷底,下滑到97.64,寿险市场首次出现微弱不景气现象。2006年,寿险市场业务结构调整成果良好,无序竞争状态得到了改善,一些关于保险行业的新政策、新法规的制定与实施使寿险市场环境得到了一定程度的改善,而经过几年激烈的市场竞争,我国寿险企业的组织结构、研发能力和市场服务等都有较大提高,从而使得寿险市场的整体竞争力得到进一步加强,景气指数开始回升,进入了新一轮的上升期。

到了2007年,由于我国寿险市场的快速发展和市场化进程的加快,宏观经济环境对寿险市场的影响加大。我国GDP增速在今年达到十年来的峰值,股市爆发式上涨,寿险市场开始了快速发展,增长率达到峰值1.42%,并且势头延续到了2008年。但是,2008 年下半年到2009年受国际金融危机影响,GDP增速回落,寿险市场增长速度变缓。随后,国家4万亿经济刺激计划和低利率货币政策,使寿险市场在2010年再度进入高峰,保费突破1万亿,景气指数达到100.76。

进入2011年以来,国际国内经济形势复杂多变,受国家宏观调控,货币政策紧缩,利率和CPI上涨、GDP增速相对放缓,股市、债市持续承受下行压力,直接影响了寿险公司的投资收益,寿险业特别是银保业务增速明显放缓,分红险产品对消费者的吸引力大幅下降。寿险市场景气指数回落到100.65,虽然不能与2010年的高点相比,但走势基本保持平稳。

三、结论与政策建议

(一)结论

1、寿险市场发展不稳定,仍处于低水平状态

2001年,景气指数为101.04,寿险市场相对景气;2002~2004年,景气指数从100.75下滑为100.32,寿险市场处于微景气状态;2005~2008年,景气指数从97.64的谷底开始回升,但也一直没有超过100的景气临界值,寿险市场始终处于微弱不景气;2009~2011年,景气指数相对平稳,寿险市场又恢复为微景气状态。由此可以看出,我国寿险市场的发展并不稳定。另一方面,2000~2011年,寿险景气指数一直在景气临界值周围波动,12年中,我国寿险市场只有2001年是相对景气,其他年份则是微景气状态或者微弱不景气状态,这说明我国寿险市场还不成熟,仍处于低水平状态。

2、寿险市场景气指数能较好地预测寿险市场的发展趋势

根据实证结果可以看出,2010年寿险市场景气指数再次达到顶峰后,2011年开始下滑,但回落幅度较小,波动率仅为-0.11%。再结合我国当前经济形势进行分析,可以预测寿险市场将进入平稳发展时期,短期内寿险业难以恢复高增长态势。本文把寿险市场的景气变动指数化,以指数的形式反映寿险市场的短期发展态势,便于正确认识寿险市场发展形势。

3、寿险市场景气指数的编制有待提高

由于数据采集的困难性,本文仅收集到12年间的数据,样本数量较小。保险业数据多为年度数据,这也使得寿险市场景气指数的时效性相对不足。本文经过定性分析和定量分析,最终采用九项指标构建景气指数体系,其中反映企业资产方面的指标比较少,所以构建景气指数的指标组仍有待改进。本文的景气指数编制还有许多不完备的地方,需要在今后实践中不断地修正和完善。

(二)政策建议

1、抓住时机,积极推进寿险市场稳健发展

根据景气指数的预测,我国寿险市场将进入平稳发展时期,我们应当抓住时机,解决前期高速增长带来的问题,认真总结寿险业发展经验、教训,积极转变增长方式,及时进行结构调整,从注重市场的发展质量和经济效益出发,把精力放在基础工作上,积极推进寿险市场稳健发展。

2、完善统计制度,加强数据管理

充足有效的数据是进行数理统计和计量经济分析的前提和基础,为了更好地发挥统计职能,避免保险行业的专家学者在分析问题时因为统计数据不足而事倍功半,甚至研究成果缺乏准确性和科学性,我国应完善寿险业乃至整个保险业的统计制度,加强数据管理。

3、优化寿险市场景气指数的编制

统计部门应完善统计制度,加强月度数据管理,为行业研究者提供丰富的数据支持,在构建寿险市场景气指数体系时多方面、多层次选取指标,增加指标数量,综合各方面因素,如指标重要程度、监督引导方向等,运用统计学方法,如主成分分析法、时差相关分析系数法等,更加合理地分配各指标的权重,进一步完善寿险市场景气指数的编制。

4、建立寿险市场景气预警系统

为了保证寿险市场能健康、稳定地发展,政府和监管部门应该通过构建数据模型、开展问卷调查等方式,创建保险监管、保险服务、保险信心等景气指数,在寿险景气指数的基础上,及时建立寿险市场景气预警系统,并实时监测数据和预警信号,帮助政府和企业经营者了解寿险市场发展状态、动力和趋势,以便决策者把握大局,引导寿险市场科学发展。

参考文献:

[1]王绪瑾.保险学(第五版)[M].北京:高等教育出版社,2011.8

[2]高铁梅,王金明等.计量经济分析方法与建模――Eviews应用及实例(第2版)[M].北京:清华大学出版社,2009年

[3]董文泉,高铁梅等.经济周期波动的分析与预测方法[M].吉林:吉林大学出版社,1998年

[4]赖福平.工业企业景气指数研究与实证分析[D].暨南大学,2005

[5]李伟.中国轿车市场的需求波动及景气指数研究[D].安徽大学,2012

[6]董文泉,郭庭选,高铁梅.我国经济循环的测定、分析和预测(I)――经济循环的存在与测定[J].吉林大学社会科学学报.1987年第3期

[7]陈迪红,李华中,杨湘豫.行业景气指数建立的方法选择及实证分析[J].系统工程,2003.4

[8]黄洪.创建广东保险业景气指数(GIPI)研究[J].保险研究.2011(11)

[9]王绪瑾,席友,龙云飞.中国寿险市场的特征、矛盾和对策研究[J]. 保险研究,2011(12)

[10]何玉东,孙溪.经济周期视野下的中国寿险业发展态势探析[J].保险研究,2012(03)

数据分析的前景第7篇

关键词:图像分割 夜景图像 图割

中图分类号:TP37 文献标识码:A 文章编号:1674-098X(2015)08(a)-0096-05

图像分割与融合是计算机视觉与图像处理领域的研究热点,特别是面向人像的前景分割,在目标检测、目标识别、图像融合等相关技术中有十分广泛的应用。其关键技术涉及到人体的定位,以及前景和背景的分离等。由于人体图像具有尺度差异大、纹理复杂、姿态变化多等特点,要从复杂背景中分离出人像信息是十分挑战的课题。特别利用家用低成本相机拍摄的夜景图像,因背景光源复杂,且在闪光拍摄的图像中前景边缘与背景信息容易交互干扰,使得现有的算法难以从这里图像中有效地分割人像区域。

目前人像分割方法大致可以分为人工交互分割与全自动分割等两类,其中人工交互分割一般是基于图割(Graph cut, GC)算法[1],通过手工标记的方式,在人像周围指定背景与前景信息,进而通过构建能量图及边切割,实现背景与前景的分离。基于Grab cut方法[2]则是在选定前景框内,通过分析背景区域与前景框内的分布信息,实现前景目标的分割。实验结果表明,基于图割的算法运算速度较快,分割效率较好,特别对复杂的背景边缘有较好的适用性,得到了广泛的关注,目前市场上已有相关的产品[3]。尽管如此,这类方法在分割过程中需要人工干预,而且在夜景人像边缘模糊的情况下分割效果不佳。

前景的自动分割主要包括基于立体视觉[4]、运动信息[5]和背景建模[6-7]的方法。其中基于立体视觉的方法通过分析视差来判别前景区域。这类方法往往对分割目标的视差范围有一定限制,视差太小前景和背景难以分离,视差过大则场景中存在大量遮挡和零匹配现象,导致分割可靠性不足;基于背景建模的目标分割方法需要利用先验信息对背景进行建模,通常是在视频或序列图像的基础上,分析场景的变化信息,以构建背景模型。此外,在图像前景自动分割中,Sun提出了以闪光/非闪光图像为数据源的抠图方法[8-9]。前提是对场景分别进行闪光/非闪光两次拍摄,在闪光灯开启时,由于前景物体较为靠前因此受闪光影响较大,对应图像更加明亮(强度更高);而没有闪光灯时,前背景的亮度区别较小,从而可以通过亮度对比信息提取前景区域。在相关后续工作[10]中,Sun将该方法拓展为Flash cut算法,实现了前景和背景的协同分割。其基本思路是根据闪光与非闪光图像的差异,分析前景与背景的统计模型,最后通过图割方法实现前景信息的分割。Flash cut提出后,得到了广泛的关注,其中文[11]将闪光-非闪光图构建的前景信息推广到图像的显著分析,取得良好的检测效果。

在简单背景下,现有的分割算法对人像交互分割与融合方面已经取得了较好的效果。然而,针对夜景的人像提取效果仍效果不佳,特别是当背景光源信息复杂,以及前景边缘和背景混合的时候,分割算法基本失效。为此,该文在闪光、非闪光图像的基础上,采用了检测+分割的思路,首先根据梯度直方图特征在非闪光夜景图像中检测人像方位;进而根据同步获取的闪光、非闪光图像差异分布,在人像候选区域统计差分直方图,并通过构建代价函数、分割能量图实现人像的分割。

该文余下内容安排如下:第二章介绍梯度直方图的计算方法,以及在夜景人像检测中的应用;第三章详细阐述基于闪光、非闪光图像的夜景人像分割算法流程;第四章通过实验分析本文算法的可靠性;第五章为论文总结。

1 基于梯度直方图的夜景人像检测

夜景人像检测的目的是确定分割的候选区域,避免背景复杂光源,以及背景运动目标等因素对分割效果的影响。针对夜景人像的特点,本文采用了基于梯度直方图(Histogram of Oriented Gradient,HOG)[12]与支撑向量机相结合的检测方法,以实现夜景人像的检测。HOG是目前最为广泛使用的行人特征表示方法之一,其主要思想是通过图像局部区域的梯度特征统计来增强判别性能。HOG特征的具体计算过程如算法1所示,其中行人图片大小为64×128,块(Block)大小为16×16,格子(cell)大小为8×8,每个块内包含4个格子,格子是计算HOG的最基本单元(如表1所示)。

根据文[12]实验设置的推荐,以及夜景图像特点,本文采用以下的设置以提高HOG的判别性能:(1)梯度计算时采用的掩膜为[-1 0 1]和[-1 0 1]T;(2)投票的时候方向角和空间位置进行线性插值,即三线性插值;(3)块内的每个象素在投票的时候进行高斯加权;(4)对块的特征向量进行归一化处理。

梯度直方图特征具有高维特点,需采用高效的分类器以实现特征的判别。由于支撑向量机(Support Vector Machine,SVM) 是建立在统计学习的VC 维理论和结构风险最小原理基础上的,它在解决小样本、非线性及高维模式识别中独具优势。为此,本文采用SVM作为夜景人像判别分类器。

2 基于闪光图像的夜景人像分割

在人像区域检测基础上,可利用闪光与非闪光图像的对比统计信息,以提高人像分割的效果。为此,本文首先根据二值分类定义了前景分割的能量函数,并针对能量函数中的数据项与平滑项展开分析。特别是数据项的设计,融入了闪光变化特点、颜色信息,以及匹配变换估计信息等。以下将分别介绍能量函数的构造以及数据项的具体计算流程。

2.1 总体代价函数

为实现前景与背景的分类,本文定义代价函数如公式1所示:

(1)

其中xp表示像素p的背景标签,即当且仅当p为背景时,xp=1,否则xp=0;Ed为数据项,表示像素p分类为xp的代价;Es为平滑项,主要用于惩罚相邻像素p,q的分类xp与xq不一致,目的减少噪声干扰,保证分割结果的平滑性;α是权衡数据项与平滑项的权重。当公式1达到最小值时,对应的前景信息为人像分类结果。

为了减少相邻像素的分类差异,定义平滑项Es如下:

(2)

其中用于调节相邻点灰度差对分类的影响。

根据夜景人像特点,设计数据项如下:

(3)

其中分别用于衡量前景分类代价、闪光与非闪光图像之间的运动差异,以及颜色信息差异,其计算方法将分别在2.2~2.4中阐述;为的权重。

2.2 基于直方图对比的前景分类代价

在公式3中,用于衡量闪光与非闪光图像中,像素直方图的变化情况。主要思路是通过对比分析闪光图像与无闪光图像的直方图信息来进行建模。如果是离摄像头比较远的物体,则受闪光的影响比较小;如果是离摄像头比较近的前景物体,则受闪光的影响比较大。因此通过分析闪光前后,直方图的变化情况,对象素点与前景之间的隶属度进行赋值。假设和分别表示闪光图像和无闪光图像的颜色直方图。若,则说明闪光之后,第k个直方图区间的象数点数目变少,也就是第k个直方图区间的部分象数点被分配到了的其他区间(具体是哪个区间不知道);若,则说明闪光之后,第k个直方图区间的象数点数目变多,说明的其他区间(具体是哪个区间不知道)上的象数点部分被分配到了直方图的第k个区间。综上,可定义代价项如下:

(4)

其中闪光和非闪光图像的rp分别取值为和。

2.3 变换补偿

公式3中的Et(xp)用于衡量闪光与非闪光图像中,对应同名点之间的像素差异。假设已经知道了闪光前和闪光后两张图像之间的位移信息m(p)。那么对于闪光前的图像而言,如果象数点的亮度信息变大了,那么是前景的概率应该相应增加。闪光前后的亮度信息差异可以用如下公式表示:

(5)

一般认为,背景的像素点亮度变化较小。因此,可以用一个高斯分布来表述亮度差异信息,即,。像素点p属于背景的概率可以用如下公式刻画,

(6)

可以看出,当时,。综上,能量项Et(xp)的可定义如下:

(7)

上式中未知的参数是。首先,可通过稀疏特征匹配来计算特征点的亮度差异信息,以差异直方图均值作为μ的初值。则可以在直方图中截取亮度差异小于某个阈值T的所有点统计得到,其中T取值为大于μ的首个局部极小点。由于同步采集的两幅图像之间尺度、角度基本一致,为提高分割效率,本文采用FAST算子[14]进行特征提取,利用ORB描述子[15]实现稀疏特征匹配,并采用RANSAC算法[16]去除错误匹配特征。

偏移量m的初值可以根据RANSAC获取的变换结构,计算像素稠密匹配来得到。由于两幅图像同步获取,且人像前景景深差异小,因此本文采用透视变换来作为像素位移初值的计算依据。在此基础上,利用光流中改进的Lucas-Kanade算法[17]来迭代计算稠密的像素变换补偿参数,具体如公式8所示:

(8)

2.4 基于混合高斯模型的前景分类代价

在公式3中,用于衡量前景信息的概率。在上述求解到的前景和背景概率的基础上,挑选出所有背景概率小于0.4的点,用于构造前景混合高斯分布[13]。具体计算方法如公式9所示:

(9)

其中K是混合高斯模型的模型数量;wk是各个模型的权重;uk,∑k分别表示第k个模型的均值与协方差。同理,计算背景混合高斯分布可以挑选所有背景概率超过0.6的像素,通过文[13]的方法统计得到。在此基础上,前景分类代价可以表示为:

(10)

2.5 算法流程

根据2.1~2.3的计算规则,本文总体算法流程如算法2所示(如表2所示)。

3 实验结果与分析

实验的目的是测试本文方法对夜景人像分割的效果。为此,本文根据实验需求采集了序列夜景图像集,其中包含背景运动干扰、背景复杂光源(夜景工程)、前景纹理变化(衣着差异)等多个不同类别,部分数据如图1所示。以下将详细描述实验的设置,以及结果分析。

3.1 实验设置

在夜景人像检测模块,HOG特征为3780维,梯度计算时采用的掩膜为[-1 0 1]和[-1 0 1]T;投票采用三线性插值。在代价函数模块,公式1中的权重α取值为30;考虑到夜景图像的闪光与非闪光图像中,像素变化十分强烈,导致部分背景隶属于前景概率也相应提升,因此应适当降低了直方图前景分布代价的权重,公式3中的数据项权重分别为5,15;公式4中的ζ=0.2;在颜色项中,混合高斯模型的数量取值为10。

3.2 结果与分析

第一组实验主要评价夜景图像的人像检测效果。由于本文的目标是自动分割出闪光图像的人像,因此只需在闪光图像中检测行人区域。图2中的背景包括复杂光源、运动目标、前景边缘与背景强度差异小等干扰因素。由于夜景人像往往背景强度相对较弱,相比之下,前景的强度、纹理特征丰富。从实验结果可以看出,采用HOG特征可以充分描述人像的表观模型,因此SVM分类器能有效提取图像中的行人区域。

第二组实验主要评价本文的图割算法对于夜景人像的分割效果。针对背景运动、局部遮挡、复杂背景等因素对分割效果的影响,我们分别选取了图3-图6用于分析分割效果。如图3(a)(b)(c)分别为闪光图像、非闪光图像、人像分割结果。从图3(a)和图3(b)中可以看出,背景存在运动目标。由于背景中的人像强度信息(光线)较弱,纹理受噪声干扰明显,因此行人检测器没有响应背景人像。而本文的算法只针对人像区域分析,因此可以有效过滤背景运动对分割效果的影响。在图4中,前景包含了部分背景信息(手臂下方),由于本文通过像素分布设置了背景概率统计信息。因此,在前景背景混合的情况下,构建的能量图能给定前景和背景不同的权重,从而利用图割算法可以有效地分割出人像区域,具体如图4(c)所示。

图5和图6用于评价复杂背景对于人像分割的影响。从图5(a)可以看出,人像上半部分的背景强度信息与人像信息接近,因此该区域的前景概率容易混淆。从实验结果也可以看出,人像下半身的背景区域纹理简单,有较好的分割效果,但是上半部分特别是肩膀附近,存在一定的错分割现象。图6的结果也印证了上述结论,即前景边缘与背景差异很小的时候,构造出的能量图相应的边权值也相应较小,导致分割后的边缘存在锯齿现象。

4 结语

目前的夜景人像分割大多是采用交互的方式提取人像外轮廓,在背景光源复杂的情况下需要大量的人工干涉。本文针对夜景人像的自动分割问题,利用同步获取的闪光和非闪光图像之间的差异,分析前景的概率分布信息。基本流程包括利用直方图特征实现人像区域检测、基于闪光图像变化分布和变换补偿的代价函数构造,以及利用图割实现人像提取等。实验结果表明本文的方法有效增强了分割的自动化程度,特别是增加了人像检测后,在背景光源复杂以及背景变化的情况下有较好的分割效果。预计相关成果在夜景图像融合中有一定的推广价值。

参考文献

[1]Boykov Y Y, Jolly M P. Interactive graph cuts for optimal boundary & region segmentation of objects in ND images[C]//Computer Vision,2001.ICCV 2001.Proceedings.Eighth IEEE International Conference on.IEEE, 2001:105-112.

[2]Rother C,Kolmogorov V, Blake A. Grabcut:Interactive foreground extraction using iterated graph cuts[J].ACM Transactions on Graphics(TOG),2004,23(3):309-314.

[3]沈洋,林晓,谢志峰,等.交互式前景抠图技术综述[J].计算机辅助设计与图形学学报,2014,26(4):511-519.

[4]Torr P H S,Szeliski R, Anandan P.An integrated Bayesian approach to layer extraction from image sequences[J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,2001,23(3):297-303.

[5]Sun J,Zhang W,Tang X,et al. Background cut[C]//Computer VisionCECCV 2006.Springer Berlin Heidelberg,2006:628-641.

[6]Mittal A,Paragios N.Motion-based background subtraction using adaptive kernel density estimation[C]//Computer Vision and Pattern Recognition, 2004.CVPR 2004.Proceedings of the 2004 IEEE Computer Society Conference on.IEEE,2004:II-302-II-309 Vol.2.

[7]Monnet A,Mittal A, Paragios N,et al.Background modeling and subtraction of dynamic scenes[C]//Computer Vision,2003.Proceedings.Ninth IEEE International Conference on. IEEE,2003:1305-1312.

[8]J.Sun,Y.Li,S.B.Kang,et al .Flash matting[M].In Proceedings of SIGGRAPH,2006:361-366.

[9]Sun J,Li Y,Kang S B,et al. Flash matting[J].ACM Transactions on Graphics(TOG),2006,25(3):772-778.

[10]Sun J,Kang S B,Xu Z B,et al.Flash cut:Foreground extraction with flash and no-flash image pairs[C]//Computer Vision and Pattern Recognition,2007.CVPR’07.IEEE Conference on.IEEE,2007:1-8.

[11]He S,Lau R W H.Saliency Detection with Flash and No-flash Image Pairs[C]//Computer VisionCECCV 2014.Springer International Publishing,2014:110-124.

[12]Dalal N,Triggs B.Histograms of oriented gradients for human detection[C]//Computer Vision and Pattern Recognition,2005.CVPR 2005.IEEE Computer Society Conference on.IEEE,2005:886-893.

[13]Blake A,Rother C,Brown M,et al.Interactive image segmentation using an adaptive GMMRF model[C]//Computer Vision ECCV 2004.Springer Berlin Heidelberg,2004:428-441.

[14]Rosten E,Drummond T.Machine learning for high-speed corner detection[C]//Computer VisionCECCV 2006.Springer Berlin Heidelberg,2006:430-443.

[15]Rublee E,Rabaud V,Konolige K,et al.ORB:an efficient alternative to sift or surf[C]//Computer Vision(ICCV),2011 IEEE International Conference on.IEEE,2011:2564-2571.

数据分析的前景第8篇

关键词:旅游业;GIS;旅游规划;旅游流量

中图分类号:F59文献标识码:A

一、引言

近年来,世界旅游业发展呈现出了良好的趋势,而中国在加入WTO以来旅游业进一步与世界各国接轨,旅游业要开拓更大的发展空间就必须面对旅游业进一步发展的瓶颈问题。当今的世界信息化程度越来越高,旅游业也不例外。旅游者需要足够的旅游信息才能做出出游的决策,旅游规划与开发者需要足够的旅游地的各种时间、空间上的信息才能进行开发建设,因此在信息技术时代里旅游业要持续健康地发展必然要借助信息技术的优势来发展旅游业,地理信息系统作为拥有分析处理海量地理空间数据的优势而被引进旅游业。

地理信息系统(简称GIS)在旅游业得到广泛关注和迅猛发展。未来几十年,随着网络信息技术的不断普及,旅游者出游依赖网络的程度将进一步提高,必然需要更加健全的信息服务系统。但作为强大的GIS,人们目前大部分局限在提供信息查询服务的开发上,不少学者也是针对这一方面做了部分研究工作,但对于GIS技术来说在旅游业中却还有极大的发展空间,在旅游开发与规划,旅游理论研究上,如旅游流、旅游者行为研究等。本文主要根据GIS技术的特点探讨旅游业中应用GIS的领域,以期构建更大的旅游信息空间。(图1)

二、旅游业中GIS应用的研究概况

近几年在信息查询服务方面应用GIS的研究有:严寒冰、刘迎春(2000)以旅游者为使用对象在《基于GIS的旅游导游服务系统设计》中详细地分析并构建了一套导游服务系统设计的理论说明。王永燕等(2002)在《基于GIS的旅游景区信息系统研究》中介绍了地理信息系统在空间数据分析方面的应用,结合景区的旅游资源,对GIS技术下景区旅游信息系统的实现进行了探讨,提出了实现方案和技术路线。王晓峰、马耀峰(2003)在《GIS在生态旅游区信息管理中的应用》一文中基于GIS的特点和功能,结合福地湖旅游度假区旅游资源信息管理的特点,分析了GIS在其开发和管理过程中的几个重要影响因素,并对其进行了处理;建立了GIS在福地湖旅游度假区中的应用模型等。

在旅游开发规划方面应用GIS的研究主要集中于旅游资源的分析评价,如蒋勇军等(2004)在《基于GIS的重庆市旅游资源评价、分析与规划研究》中利用GIS在处理地图数据的优势上分析了潜在旅游资源分布的空间结构特征。宋力、王宏、余焕(2002)在《GIS在国外环境及景观规划中的应用》一文中介绍了国外关于GIS与环境规划的理论研究,并介绍了GIS在环境资源规划分析与评估中的应用。周晓(2005)在其《GIS在景观规划设计中的应用》中详细阐述了GIS技术在景观规划设计中比较典型的应用环节与类型以及需要注意的关键问题等。

在旅游地规划方面应用GIS分析旅游地发展条件的实践研究,如陈小华、张利权(2005)在《基于GIS的厦门市沿海岸线景观生态规划》中根据景观生态学的基本原理和方法,运用GIS技术与因子加权叠加法,对厦门市沿海岸线进行了多目标的景观生态适宜性分析,并依据城市发展规划对沿海岸线及近岸海域的发展要求,提出厦门市沿海岸线及近岸海域的景观生态规划方案。张红贤(2002)在其硕士毕业论文中详细地论述了旅游开发规划中如何应用GIS,较详细地分析了GIS与规划思路的切入点,并且系统地构建了规划过程中的资源调查、评价以及各项规划数据的查询、编制图库的过程。黄非亚、王晓东在其《GIS技术在旅游规划中的应用初探》中分析了旅游规划过程中应用GIS的特点以及规划的过程。

三、GIS在旅游业中的应用领域分析

(一)旅游信息查询功能。旅游业具有和地理位置极其密切的关系,如旅游景点的分布、旅游服务设施的位置、道路信息等在地图上都有相应的地理坐标。而GIS可以提供非常全面的地理区位信息,采用GIS的管理空间数据的功能,能在一张电子地图上集成极其丰富的空间、非空间信息,用信息管理软件统一管理,从宏观上对旅游信息进行检测。

目前,利用GIS技术开发旅游信息查询系统具有良好的发展态势,网络上借助于信息管理软件进行管理的旅游信息网站不胜枚举,内容包括具体的景点景区方位、交通最优路径的选择、旅游目的地环境、人口密度,等等。

将来随着GIS技术的进一步发展,旅游信息也将与个人数字手持设备(简称PDA)相结合,即旅游通掌上电脑,为旅游者提供实时、快速、方便的移动数字旅游概念。旅游通掌上电脑是针对旅游行业,整合旅游资源,采用现代PDA技术、GIS地理信息处理技术和计算机数据处理技术,建立庞大、专业的旅游资源数据库,为用户提供全方位、全时域空间位置信息和旅游资源信息,并能在电子地图上标定显示用户所在的任一旅游景点地理位置,同时显示所在地的相关行业信息及前进方向、交通状况等信息,使用户在最短的时间内了解本地旅游资源的情况,实时确定所处位置,了解周边区域的地理信息,实现电子信息导航。

(二)旅游开发与规划中的应用。旅游开发与规划的创新包括规划技术方法的创新,因为新的内容、新的目标需要新的技术支持,萌发于20世纪五六十年代的GIS技术为景观界揭开了规划设计的新篇章。GIS技术有助于解决规划开发、设计建设有史以来悬而未决的三大基本难题:第一,对于规划设计现状环境,进行系统、量化、准确快速的数据信息表达;第二,对于规划设计现状环境及方案,实行理性化、定量化、系统化的分析评价;第三,在建设施工之前,模拟根据规划设计方案建成之后可能出现的情形进行评估预防。通过获取的旅游资源空间数据,应用GIS进行:

1、旅游资源空间分析。目前,GIS技术在旅游规划中的应用较多集中于旅游资源空间分析方面的研究实践。通过建立旅游资源空间信息数据库,录入旅游地地理信息数据,设计资源评估模型,应用GIS软件在原有的地图编制上直观地对资源进行评估。如在蒋勇军的文章中有较详细的个案研究。

2、旅游地发展条件分析。旅游地发展条件分析首要的是可以应用GIS技术进行土地适宜性分析,它是景观规划及场地设计中一项重要的前提工组,主要是通过层次分析法选取影响自然、政治、经济、文化等的主要因素应用GIS软件进行定量的图形数据分析,然后叠加各种数据的图层,从而在了解当地情况、现有政策、经济现状、环境科学的合理性基础上,对土地适于不同开发利用方案进行评估。其次是旅游地旅游灾害类型和风险分析,主要通过构建旅游地灾害风险指标、效益损失测度指标以及旅游灾害预防体系,再结合监测到变化中的地理环境数据应用GIS软件分析、成图,直观地把各类威胁反映到管理部门,以求提早预防与改善旅游地环境,实现可持续发展。

3、旅游客源市场分析。旅游规划过程中旅游客源市场的分析预测是不可或缺的,旅游地很大一部分设计都是根据目标旅游者的爱好、兴趣、特征等因素来进行的,缺少了对目标旅游群体的研究,就会使规划险入迷茫,脱离实际。应用GIS进行市场分析主要是通过对旅游地人口分布、吸引力影响因素及目标群体分布等的地理信息数据进行空间分析,考虑旅游者空间行为规律的因素,分析出目标市场的地域范围,对分析出的不同目标市场进行客源属性分析,最终提供给规划管理者对于实现不同营销策略的参考方案。

4、旅游环境的空间分析。旅游环境的空间分析主要是旅游廊道的划分,环境廊道概念由美国景观规划大师提出,即将水体湿地、地形坡度、植被分布等环境决定因素分别绘制成图,然后叠加起来,划分出环境廊道,方法如下:(1)建立水体层。使用缓冲区分析功能建立环境廊道,比如可以产生一个距河流100m的缓冲区,以控制建筑项目保持水土、保护植被;(2)建立湿地层。使现有的数字化的湿地系统图与其他主题图层相吻合,包括投影方式、坐标系统、单位、精确度等;(3)建立陡坡层。建立该区域的地表模型,并将这一地表模型转化成光栅文件,然后计算出坡度,利用坡度图,可以建立新的栅格网络来表示具有某一坡度范围的区域;(4)建立环境廊道。将三个主题图层叠加到一起,重叠部分就构成了特征多样并且鲜明的线形环境廊道,利用这个环境廊道图,就可以规划优先保护地区。

5、旅游景区经营管理中的静态与动态空间配置分析。应用GIS可以进行景观视线、视域分析,景观服务设施配置等的分析,景观视线、视域分析对地理空间信息的准确度要求较高,而GIS软件可以依据地图数据的采样精度同等准确地表达出景观区域的地理空间信息,对于各种要求的视域、视线设计分析能达到很高的精度,也同时方便于宏观与微观设计。对于服务设施配置问题的分析主要是根据游客游览时间与人的生理功能等特征来布置园林小品、洗手间、休息亭,在GIS上表现为较普遍的简单宏观布置问题。

旅游流量流向分析,GIS软件提供了很好的动态监测旅游地旅游流向的技术,用时空刻度表达出的旅游地流向流量问题直观体现出来,更易于管理者从宏观角度及时采取应对补救措施。主要通过各个监测点动态获取的数据表达在GIS地图上,提供给管理者直观的旅游流量流向管理问题,有益于景区的设施布置与分流,从而更人性化的管理与设计。

旅游业发展对旅游地的经济、社会影响研究,主要应用GIS软件对各影响因素在地理空间图层中的体现进行叠加,分析出旅游业发展过程中积极与不利的方面在旅游地空间上所体现出来的特征,以便进行布局管理,优化发展战略的制定。

(三)旅游专题制图。自从数字地图在GIS技术支持下成为可能以后,较之传统的纸质地图有了相当大的突破,从传统的只能二维表达地理地图信息转变成可以从三维甚至四维来进行地表要素描述,地图的可视化与精度都比传统的纸质地图上了一个大台阶。不过数字地图同样出现了一些新的问题,如对比例尺的淡化,目前数据地图有过多的人工干预痕迹等。

在旅游规划中应用GIS软件制图正方兴未艾,因为GIS具有很强的图形和文本编辑功能,数据维护也非常便捷,可大大降低出图成本,避免传统制图的繁琐工序。G1S中图形数据库是分层存储的,它不仅可以为用户输出全要素图,而且可以根据用户需要分层或叠加输出各种专题图。如将景点分布图、道路交通图、服务设施分布图和地形图叠加,可以为游客提供一幅详细的导游图。

四、GIS在旅游业中的应用问题分析

首先,根据目前关于GIS与旅游业应用问题的研究实践成果可以看出旅游业内人士并没大力推进旅游业中GIS的广泛应用。这种认识问题也是必须首先得到解决的。而另一项根据科技部国家遥感中心对我国地理信息产业现状作的调查可以看出,目前发展存在的普遍问题,反映经费不足的占39.2%、涉及体制方面原因的占17.6%,其他还有市场不规范的占17.1%、队伍不稳定的占12.1%和政策环境不健全的占11.6%等。这个排列也表明,地理空间的技术是一项高新技术,它所涉及的领域是一项技术密集性产业,无论是对硬件、软件设备的购置,还是对数据生产与更新的投入,都不是一个小数字,投入与产出反差很大,这是影响发展至关重要的因素。

其次,数据建设共享、数据的标准化一直是业内人士一致呼吁、且一直难以解决的“瓶颈”问题,数字地图是个庞大的系统,但对于基础数据源的建设是有很多共性的,解决某些基本数据的来源,从而降低整个规划设计的数据输入费用,对于大面积的用地范围而言,景观规划往往是一个动态的过程。因此,从规划开始就要考虑到数据的更新和维护,要有相应的机制,使数据采集工作逐步地变为日常性事务,这是持续运行的必备条件。

再次,在景观规划设计中的应用数据来源、输入与更新是最大的障碍。信息收集,整理输入是耗资最大、周期最长的任务。而GIS软件在处理地理空间信息时的逻辑判断、推理、演绎方面则较为欠缺,这就需要进一步开发出更好的GIS软件来支持规划中不断提出的更高要求。

五、GIS在旅游业中的应用展望

GIS技术必将成为信息化的主流,旅游业必须顺应信息化的潮流,积极探讨应用广泛3S(地理信息系统GIS、遥感RS、全球定位系统GPS)或5S(前面3S加上数字摄影测量系统DPS、专家系统ES)的集成,使得测绘、遥感、制图、地理、管理和决策科学相互融合,成为快速而实时的旅游地空间信息分析和决策支持工具。

(作者单位:电子科技大学中山学院)

主要参考文献:

[1]边馥苓.地理信息系统原理和方法[M].北京:测绘出版社,1996.

[2]严寒冰,刘迎春.基于GIS的旅游导游服务系统设计[J].浙江工程学院学报,2000.17.

[3]王永燕等.基于GIS的旅游景区信息系统研究[J].济南大学学报,2002.16.

[4]王晓峰,马耀峰.GIS在生态旅游区信息管理中的应用[J].西北大学学报,2003.33.

[5]刘颂,许世远.GIS在旅游管理和开发中的应用[J].曲阜师范大学学报,2000.26.

[6]蒋勇军等.基于GIS的重庆市旅游资源评价、分析与规划研究[J].自然资源学报,2004.19.

[7]宋力,王宏,余焕.GIS在国外环境及景观规划中的应用[J].中国园林,2002.6.

[8]周晓.GIS在景观规划设计中的应用[J].科技咨询,2005.27.

[9]夏既胜,张静,谈树成.基于组件式GIS的云南省易门县旅游资源查询系统的设计与实现[J].云南地理环境研究,2005.17.

[10]陈小华,张利权.基于GIS的厦门市沿海岸线景观生态规划[J].海洋环境科学,2005.

[11]张红贤.旅游资源开发与规划中的GIS应用研究[J].陕西师范大学,2002.

数据分析的前景第9篇

关键词:数据挖掘 关联分析 聚类分析

尽管目前的IT技术和网络应用发展迅猛,从网络获取包罗万象的资料已经几乎没有困难。然而目前从事档案工作的存放或利用纸质档案获取有用信息还有许多困惑。在不同的工作中积累起大量的数据信息,不同类别和科目,不同的承载体。面对这些有针对性庞大的数据或数据集,如何快速分类存放,如何从中快速检索有用的信息成为档案工作的当务之急。目前借助数据挖掘技术作为采集分析档案的工具是较为便捷的。所谓数据挖掘可以从浩瀚的数据中快速提取潜在有用的信息的过程,尽管这些数据潜隐在巨量纷繁、相互交叠、模糊随机且事先未知的档案事件中。利用这样一个有效的分析工具可以实现快速检索出高校档案中有用信息和相关知识。

本文分别简述各种数据挖掘方法,并举例学校档案管理加以说明,紧扣高校档案管理,叙述在档案管理中应用数据挖掘分析技术的一般步骤,再以三个实际案例来说明利用数据挖掘这个有效工具快速检索高校档案有用信息,最后明确结论数据挖掘作为数字化管理的先进便利高效的工具,在高校档案管理方面大有发展前景。

1、数据挖掘方法

数据挖掘(Data Mining,DM),从大量数据中抽取出有用的信息和知识,形象喻为在庞大数据山中挖掘出有用信息。挖掘数据加以分析的技术可以实现对档案信息在需求量、系统性、时效性和快速检索方面的要求。常用的数据挖掘方法有下列几种:

1.1 关联分析(Association analysis)

关联是反映两个或者两个以上事件之间存在某种依赖或联系规律性。设想在数据集中如果一

项事件或数据与多项数据之间的相关联系,那么其中一项的属性值就能够依据其相关项的关联属性值推测出来。关联可分为时序关联、因果关联和简单关联,利用关联分析的目的就是找出数据集中所有频繁相关属性项目集,这是数据挖掘中最成熟的技术之一。例如教师教学档案与科研档案的关联,可以发现与教师的成长和发展有很大关系;还可以发现学生的学籍档案与专业发展的关联,得出学生就业率的变化趋势。

1.2 聚类分析(Cluster analysis)

聚类是把数据按照标定距离d或相似度r划分成若干组别,“物以类聚”即同一组中的数据均在标定距离和划定的相似度以内,不同组中的数据之间则保持较大标定距离和相似各异。聚类之前不知道组别数和各组的相似特性,聚类分析可以根据标定距离d 或相似度r的取值不同可以将数据分成不同的组别数和共有的特性,从而可以发现数据的分布模式和频度。例如可通过标定分数线定量地将学生分为成绩优秀、良好和一般的几组;也可以通过档案的多种属性列成矩阵分析,定性地将高校档案聚类成不同类别的档案。

1.3 分类分析(Classification analysis)

分类就是按照数据集合的属性和典型特征表述,并利用这种表述构造区分模型,一般用规则或决策树模式表示分类,分类在于事先明确类别,适宜于决策划分大类,而聚类在于标定值的确定后才能明确组别数,可在事后先确定数据的分布模式,适宜于快速找出数据间的差异。例如学校可根据职称将教师分成不同的类别,就可以职称划分并结合工作积累来区分新老教师,以采取不同的待遇分配方案;也可以根据工作属性或评定因子来确定档案类别的划分。

1.4 预测分析(Predictive analysis)

研究历史和当前的数据呈现统计的变化规律,利用动态规律推测未来数据的种类及特征即为预测。通过预测可以对分类进行调整,对聚类进行相似度调适,同时提高快速检索的准确指向性。例如利用学校教职工各支队伍建设培养档案进行预测分析,从而对学校人力资源的配置优化有发展的判断;利用历届学生成绩考核档案的预测分析,可对当前的教学工作做一定的调整。

1.5 偏差分析(Variance analysis)

在数据集中的数据之间存在很多差异,而偏差是对差异和极端情况的数学表征,若发现数据集中数据有偏离异常的现象,偏差分析就可揭示内在原因并作出相应调控。例如在某次物理测试中有30%的同学不及格,为了提高教学质量,教师就要找出这30%不及格同学的动因,作出正确的分析和判断,提高下次测试的及格率。还可以根据历次档案的比对分析,找出数据信息出现偏差的工作原因或档案信息因存放粗忽的失真。

2、数据挖掘应用到高校档案管理中的技术步骤

数据挖掘分析技术要求对档案信息实现数字化管理。从完善高校档案资料的建档、备案、修改、备份、保存等各个环节开始,对档案信息进行录入和数据转换,以实现数字化管理。为提高档案检索和利用的效率,充分利用数据挖掘使查询检索变得更加便捷。数据挖掘分析技术促进了档案管理的科学规范化管理,提高服务效率,还能确保了数据的准确性,提高工作效率,缩短工作时间。

2.1 确立目标,划定需求

利用数据挖掘要避免盲目性,首先就必须清晰地明确要快速检索档案的业务问题,确立利用数据挖掘的目标和划定检索的需求。明确了档案数据挖掘的目标,才能确定检索的需求,制定数据挖掘的计划。

2.2 有效聚集,构建模型

(1)选择数据。在现存档案的庞大数据集和数据库中搜索相关的内、外部数据目标信息,提取适宜数据挖掘的数据信息;

(2)预测数据。分析研究和甄别档案数据信息,有必要进行数据的加工、集成等,剔除重复或异常的数据信息,选择规范的数据并定义数据类型;

(3)数据转换。这一步决定数据挖掘的关键,数据转换就是将档案信息数据转换成可利用的数据,再将数据集成为一个针对挖掘算法的模型。

2.3 筛选算法,实施操作

按照档案的功能、类型和事件转换的数据特性,筛选和优化适宜的算法,对所有经过转换的数据实施挖掘操作。若是良好的算法,其结果没必要完全符合已有数据,但所建模型对大量未知的数据集中的数据信息应有较好的预测。认真考察不同的模型以判断哪种模型对所需解决的问题最有效,这一步是数据挖掘的核心环节。如决策树模型、相似聚类模型都属分类模型,即将一个事件或对象归类;回归分析则是通过具有已知值的变量来预测其它变量的差异值。按时间序列排序即是用变量的过去值来预测未来值。

2.4 评估模型,分析结果

为验证模型的有效性、可信性和可用性,需要对模型进行评估。我们可以预测模型的准确性、运行速度、实现代价和效率精度等属性。分析模型的建立和检验是一个反复的过程,通过这个阶段的分析工作,能使档案检索以最优或较优的模型运行。

2.5 部署应用,快速检索

分析和评估数据挖掘的结果,最终转换成检索用户能够理解的档案事件信息和知识。须将挖掘得到的信息归档返馈给检索需求系统,对挖掘抽取的有用信息采取必要的修正措施,迅速消除与以前信息和知识可能存在的冲突,并将分析所得到结果集成到档案检索结构中去。在应用模型的过程中,还需要不断地对模型进行评估和检验,并采取适当的加工和调整,以适应不断变化的应用环境而实现快速检索。

3、数据挖掘在高校档案管理中的应用

3.1 聚类分析在高校教师教学质量评价中的应用

对高校教师的教学质量评价,办法很多,争议也很多。我们根据聚类分析原理,使用层次聚类分析法是比较科学的。若以分数来评价,教师之间的分数差异很小,水平差异不明显。因此不以分数排名而以分类为好,宜分为优秀、良好、合格和较差四个等级,等级不宜分得太多。

在进行等级分类前,设将教学质量评价指标体系中的十个指标评分,按ABCD四个等级分别记为4、3、2、1分。若有20位教师从事基础课程《大学外语》教学工作,让学生测评,以班为单位,每个学生对任课教师的各项指标打分评价。将20位教师的评价实测数据输入计算机测评系统进行数据处理,按数据挖掘处理要求计算平均得分,最高得分和最低得分,最后将20位教师的评分情况返馈输入计算机分析系统得到20×10矩阵表,再经快速聚类检索:

(1)如果聚成两类,则结果为:

I. 1,2, 4,5,6,7,8,9,10,11

II. 13,14, 3,15,17,12,16,18,19,20

(2)如果聚成三类,则结果为:

I. 1,2, 4,5,6,7,8,9,

II. 10,11, 13,

III. 14, 3,15,17,12,16,18,19,20

(3)如果聚成四类,则结果为:

I. 1,2, 4,5,6,7,8,9,

II. 10,11, 13,

III. 14, 3,15,17

IV. 12,16,18,19,20

这样分类按十项指标评分,再按20×10矩阵数据分堆成类,这比只按照分数累聚进行划分准确和人性化,使水平相近的教师处于同一层次。避免因差0.1分的僵硬因素,使水平相差不大的教师落入不同等级而造成人为矛盾,评价也不客观。其中因为使用了计算机分析处理系统,数据挖掘分析可以按需求迅速得到结果。

3.2 关联分析在高校档案个性化利用中的取向应用

利用数据挖掘算法的关联分析,广泛研究和运用的是决策树算法。以本校档案馆调研用户利用档案情况分析为例,可说明决策树算法在关联分析中的简单明了的作用。一般档案馆要求各用户查阅档案前要进行个人信息登记,用户可以方便的通过各种方式进行查询所需资料和信息。档案馆的工作人员通过信息关联到用户查询,从高校教师用户的查阅兴趣的情况进行关联,可以得到模型树1,其中清楚,年龄在20~30岁之间的年轻职工喜欢调阅成果影响档案,年龄在30~40岁之间的教师大部分是关心学校发展和激励机制档案。而年龄在40~50岁之间的则主要是调阅学校发展档案,很少查阅成果影响档案。再从用户身份关联档案类别得到决策树模型2,分析明确,学校机关人员调研档案的内容和偏好与教师科研人员有明显不同,学校机关人员主要偏重于激励机制的档案,查阅成果影响则主要是教师科研人员。通过关联分析可知,档案人员能够按照教职工的不同要求或习惯,能够有指向性地快速检索,同时为用户组织和提供更多、更好的高质量信息(图1)。

3.3 分类分析在高校新校区绿化建设中的应用[25,26]

分类分析以本校新校区绿化建设布局为例,设定校园绿化建设的定性评价因子,对校园分布的绿化景观建设图片档案进行筛评,最终可快速检索得到绿化景观建设的取向因子评价的分类。

具体作法是选取校园建设中某一绿化景区为研究区域,通过对研究区域的绿化景观设计展评,以500张设计效果为图片档案。其中精选20张具有代表性的设计图,并设定20对形容修饰辞,交由学校师生进行问卷调研。采用正负对称评定尺度,其排序为-2,-1,0,1,2,经整理得出真实的矩阵评价结果。其中列向量1~20分别代表20张设计图,代表校园建设中20个绿化景观。

然后行向量为对图片中景观描述的20对形容辞,1~20依次代表:空间、层次、体积、形体、韵律、幽静、熟悉、色彩、关联、变化、动感、连续、整齐、吸引力、光感、氛围、与主体建筑的协调、植被覆盖、生命力象征、美感。再使用Mathlab多元统计软件对上述的调查数据进行划分类别分析。

从矩阵分类结果看,16、20;12、13;5、9;10、17;2、4两两分别构成同类。

从分析层次图中明确,以d=0.35为界,可以修饰形容辞,把这些校园绿化景观分成4类;

若以d=0.28为界,可以修饰形容辞,把校园绿化景观分成5类:

其中16(氛围)、20(美感)、14(吸引力)、6(幽静)、12(连续)、13(整齐)、19(生命力)、7(熟悉),这些因子定义为氛围因子,它们代表了绿化景观的氛围;

3(层次)、5(韵律)、9(关联)、10(变化)、17(与主体建筑的协调度)、8(色彩丰富)、15(动感)、11(光感),故将这些因子定义为形式因子,它们代表了校园绿化景观的形式;

2(体积)、4(形体),故将这些因子定义为体量因子,它们代表了绿化景观的占有体量;

18(植被覆盖度),故将其定义为环境因子,它代表了校园绿化景观的植被覆盖状况;

1(空间),故将其定义为整体因子,它代表了校园绿化景观的空间感和整体性。通过分类划分可将校园绿化景观评价简化为氛围因子、形式因子、体量因子、环境因子和整体因子。此例通过设计图片档案和繁复的形容形容辞,利用分类分析可以快速检索到随机又能达到满意的权重较大的五因子评价体系。从而可以快速检索到校园绿化景观建设的分类信息。

4、结语

目前数据挖掘(DM)分析仍然是一个全新的研究领域,新的数据挖掘方法和模型在不断更新,随着计算机、网络和数据库等技术的发展,作为高新技术在不断提升和改进,其分析应用领域日趋广泛和深入。虽然这项技术的应用还存在许多待解决的问题,亟待提高的是超大规模数据信息的检索效率。本文通过本校实例说明对档案信息挖掘利用可以快速检索不同档案中的有用信息,使档案部门主动提供有效服务。

参考文献

[1]胡春红.数据挖掘技术在高校信息化管理中的应用[J].长江大学学报(自然科学版),2010,7(3):592-594.

[2]李雄飞,李军.Data Mining and Knowledge Discovery.数据挖掘与知识发现[M].北京高等教育出版社,2003.

[3]Jiawei Han,Micheline Kamber著,范明,孟小锋等译.数据挖掘概念与技术[M].机械工业出版社,2001.

[4]王玮,蔡莲红.关联规则的高效挖掘算法研究[J].小型微型计算机系统,2002,23(6):708-710.

[5]殷云霞,杨松涛.关联规则在图书管理中的应用[J].河南工程学院学报(自然科学版),2011, 23(1):67-71.

[6]许海洋,汪国安,王万森.模糊聚类分析在数据挖掘中的应用研究[J].计算机工程与应用,2005,(17):177-179.

[7]刘放,叶菲.改进的聚类分析算法在高校人力资源管理中的应用[J].皖西学院学报,2011,2011,27(2):39-41.

[8]肖明,李国俊,杨皓东.国内信息资源管理研究热点分析[J].情报科学,2011,29(4):535-540.

[9]崔玉华,李俊杰,刘国华,王东方.基于分类挖掘的企业定单分析系统[J].计算机系统应用,2007,(10):11-14.

[10]程兰芳,陆敏.我国高等教育投入的时序建模与预测分析[J].中国市场,2011,18(5):152-154.

[11]李阳生,未来档案开发利用趋势的预测分析[J].档案学通讯,2002,(2):34-35.

[12]胡小勇,教育信息化政策执行偏差分析与对策研究[J].中国电化教育,2011,(5):35-39.

[13]马秀麟,衷克定,张倩.学生评教偏差分析与控制模型研究[J].现代教育技术,2011,21(2):40-44.

[14]杨光.浅析数据挖掘在CRM中的应用[J].情报科学,2005,(02):119-121.