欢迎来到易发表网,发表咨询:400-808-1701 订阅咨询:400-808-1721

关于我们 期刊咨询 科普杂志

数据信息论文优选九篇

时间:2023-03-21 17:13:14

数据信息论文

数据信息论文第1篇

科学技术的进步实现了计算机技术的全面升级,计算机数据库技术能在满足信息统筹管理的基础上,对相关数据进行系统化整合。其一,计算机数据库技术具有组织性特征。在计算机数据处理过程中,由于数据具有一定的连接性特征,因此,要将具有关联结构的数据整合在一起,从而形成统筹化的数据库。主要是借助一种特定的关系进行数据组织以及匹配,确保组织解构特征的实效性,也能强化数据之间的关联维度[1]。其二,计算机数据库技术具有共享性,在数据应用过程中,最重要的就是数据的共享模式,也是建立计算机数据库技术的主要目的,因此,要充分发挥数据的价值,就要结合数据模型和数据共享参数进行系统化处理以及信息管控,确保使用效率的完整度,也为信息利用效率优化奠定坚实基础。

二、计算机数据库在信息管理中的应用现状

就目前技术的发展结构而言,在计算机数据库技术实际运行过程中,整体技术维度和技术运行机制也在发生改变。第一,计算机数据库技术的应用范围在逐渐扩展。在实际生产生活中,应用计算机数据库技术的频率和市场前景越来越大,无论是工业、农业以及文化产业等,都将其视为有效的信息处理工具[2]。因此,计算机数据库技术的安全性和适配性尤为重要,各行业也在自身发展进程中不断摸索和技术优化,真正建立切实有效的管控模型和管理机制,确保管理维度的实效性,也为信息结构优化奠定坚实基础[3]。第二,计算机数据库技术的安全性也在探索中逐渐得到强化,也突显出计算机数据管理项目的具体要求,只有优化其安全价值,才能更好的建构高度机密性以及敏感性数据管理维度,保证了信息备份管理以及恢复功能的有效性,对于数据信息的复制和备份,要在优化信息维度的基础上,真正实现了数据库的安全性升级。

三、计算机数据库技术在信息管理中的应用优化路径

(一)优化计算机数据库技术在信息管理中的安全性

要保证数据完整性,就要从安全应用以及安全管控模型出发,建构系统化管理维度和管控要求,保证数据在得到共享的同时,相应的数据信息也是安全准确的。因此,技术人员要结合计算机数据库技术的相关要求,提升信息完整度和安全性[4]。

(二)优化计算机数据库技术在信息管理中的实践性

在实际信息管理和信息控制过程中,要积极落实理论和实践的融合机制,确保管理维度和管理效果的最优化。伴随着计算机技术的高速发展,将数据库原理和数据库管理技术模型进行深度管控,是提升数据科学性以及合理性的重要路径,也是研究数据分析机制以及计算机数据库技术应用模型的重要参数,因此,要保证理论联系实践,建构计算机数据库技术应用整体。

(三)优化计算机数据库技术在信息管理中的技术性

对于计算机数据库技术来说,最基本的就是技术参数,因此,要保证计算机数据库技术在信息管理中得到推广,最基本的就是要保证技术模型的安全性和准确性,并且积极落实计算机共享体系。计算机数据库技术最根本的要求就是要规避数据库被非法入侵,确保其技术安全和信息共享安全。但是,在实际管理机制中,信息的绝对安全存在风险。提升计算机数据库技术的技术安全性,能更好的落实信息应用价值,确保信息维度得到有效优化。因此,相关项目技术人员要利用加密技术对非共享信息进行系统化管控,提高管控效果的同时,积极落实技术性管理要求,借助权限管理机制、数据加密技术以及强制存取控制技术等措施,进一步优化计算机数据库技术的技术安全性[5]。

四、结束语

总而言之,在信息管理过程中积极应用计算机数据库技术,能在满足共享需求的基础上,充分发挥信息的实用性价值,确保信息得到充分利用,也为实践优化提供动力,确保技术模型以及信息管理维度之间形成有效的控制机制,也为数据应用研究奠定坚实基础,保证计算机数据库技术和信息管理之间的优化契合。

作者:陈文杰 单位:

参考文献:

[1]王瑜.探究计算机数据库安全管理与实现途径[J].建筑工程技术与设计,2016,15(11):2074-2074.

[2]温林芝.试析计算机数据库安全管理技术与方法[J].数字技术与应用,2015,15(04):183-183.

[3]赵宏飞,国静萍.试论计算机数据库的安全防范技术及安全管理[J].数字技术与应用,2014,15(04):190-190.

数据信息论文第2篇

关键词:土地信息系统、数据质量、误差、分辨率、坐标变换、矢量数据、栅格数据、拓扑

Abstract:DataisveryimportantforLandInformationSystem,AkeytoLandinformationthesystem''''sdevelopmentssuccessiswhetherthedataquantityisaccuracy.ThispaperwillStudythedataquantitytheprobleminLandinformationthesystemestablishtheprocess.

Keywords:LandInformationSystems;DataQuality;Error;Accuracy;RemoteSensing;Digitize;Resolution;CoordinateTransformation;VectorData;RasterData;Topological.

一、前言

土地是人类的宝贵财富,是人类社会进行物质生产所必需的基本条件和自然基础。如何科学、合理地利用有限的土地资源,如何及时了解与掌握土地利用变化数量和空间特点,对于保持耕地总量动态平衡和土地持续利用具有十分重要的意义。

随着社会经济的日趋多样化,土地部门的业务工作及范围也在不断扩大,原有的靠手工操作,图纸管理的模式已经越来越不能满足高效率的需求。为强化土地管理,满足社会对土地资源信息更多、更细、更完善的服务要求,各土地管理部门纷纷加入信息化、数字化的改革大潮。特别是在市场经济条件下,因土地管理部门工作的严肃性、准确性、科学性和规范化要求,管理中任何规定的确定和变更都需要完成大量的信息收集、分析、综合、决策和评估等工作,土地管理也只有强有力的信息技术(IT)的支持下,才能做到真正的科学决策和管理。

土地信息系统(LIS)是地理信息系统的一个分支,是一种基于宗地[以宗地(地块)为单位]的计算机管理信息系统。是一种利用计算机技术及其属性数据进行采集、处理、管理、查询、分析、应用和维护更新的空间信息系统,是土地管理的现代化工具,是土地规划和管理定量化、科学化的方法、手段。但是,在土地信息系统的建设过程中,还存在许多问题,给土地信息系统的建设及发挥带来一定困难。这里仅对土地信息系统建设中的数据质量问题进行探讨。

二、对LIS数据质量的认识

数据是一种未经加工的原始资料,是客观对象的表示,它可以是数字、文字、符号、图像,数据是信息的具体表达形式。一个LIS系统包括空间数据、属性数据、空间数据之间的关系以及空间数据与属性数据之间的关联。

人们往往以为计算机为基础的信息系统的数据质量是可靠的,很少怀疑利用信息系统产生的分析结果在数据质量方面会有问题,但事实远非如此。在某些情况下,由于多种原因,计算机分析的结果甚至会比手工分析的误差更大。这里除软件、硬件的质量问题,计算方法上的问题,以及分类、编码、输入、操作的明显疏忽外,数据本身的质量是重要的原因。

众所周知,数据是LIS的“血液”,是组成系统的重要元素。数据质量的好坏是土地信息系统成功与否的关键所在;数据质量的高低优劣,都直接影响到土地信息系统的经济效益和社会效益,决定了系统应用价值的大小;数据的可靠,质量的好坏将直接影响到整个系统的成败。系统如果不能提供正确、可靠的信息,这个系统也就失去了存在的价值。

数据质量的好坏是一个相对概念,并具有一定的针对性。衡量其好坏主要有以下几个指标:误差、数据的准确度、数据的精度和不确定性[1]。数据质量是数据整体性能的综合体现。

统而言之,数据的质量问题主要表现在两个方面:一是数据是否及时反映了现实世界;二是数据是否保持了一致性和完整性。

土地信息系统的数据量大,数据来源广,数据采集的任务重,在数据库建立过程中会出现许多人为和系统的误差,甚至还有可能产生数据错误,最后采集的数据无法准确反映规划和管理的实际状况,建立在此数据库基础上的系统往往也就达不到管理自动化辅助决策的目的,而只不过是“看看而已”的一种“摆设”罢了。

数据库(包括空间数据库和非空间数据库)是土地信息系统最基本、最重要的组成部分,也是投资比重最大的部分。数据质量的好坏,直接影响系统的功能和应用。不仅要根据技术规程衡量数据质量,还要从数据使用角度分析数据质量问题。数据质量通常是指数据的可靠性和精度,它主要用数据的误差来度量的。现就土地信息系统建立过程中的数据质量问题作进一步的探讨。

三、数据源质量的问题

土地信息系统的数据源指建库中所需要的各种数据类型的来源。它是土地信息系统最基本、最重要的组成部份。土地信息系统的数据源多种多样,主要包括有:地图,地图是系统最主要的数据源,因为地图是地理数据的传统描述形式,是具有共同参考坐标系统的点、线、面的二维平面形式的表示,内容丰富,图上实体间的空间关系直观,而且实体的类别和属性可以用各种不同的符号加以识别和表示。土地信息系统其图形数据大部分都来自地图,土地信息系统的属性数据主要有地籍图、宗地图、土地详查图、土地利用现状图、行政区划图、专题图、乃至地形图等各种图件的矢量化地图数据。二是遥感影像数据,遥感影像数据是一个极其重要的信息源。通过遥感影像可以快速、准确地获得大面积的、综合的各种专题信息,航天遥感影像还可以取得周期性的资料,这些都为土地信息系统提供了丰富的信息。三是统计数据,包括土地的分类、面积、权属、分布及质量、等级状况、利用状况、非法占地等统计资料。四是实测数据,包括GPS点位数据、地籍测量数据等。五是数字数据,包括数字图形数据和属性数据。数字数据主要有地籍号、档案卷宗号、地类号、图号、手簿号、宗地界址点点号及坐标控制点坐标,宗地面积,面积中误差、年代、日期等等。属性数据包括图形、图像以外的各种文字、数字信息。其中文字信息主要是与宗地档案,文件档案组成相关的各种检索和查询信息(如:土地权利人姓名或单位各称、土地座落,文件档案的标题、发文机关、公文字号等等),以及土地登记、地籍调查、权属审核、登记发证各办公流程中的各种键盘输入信息。六是各种立法文件和文字档案,主要有地籍档案、文件档案等具有法律效力或需要经常查阅的原始文件材料,它们是土地信息的重要组成部分,在土地的规划管理中起着很大的作用。

数据源质量问题指数据的采集和录入中可能产生的误差,建库所需的各种类型的数据的可靠性和精度。

从土地信息系统建立的过程来看,它的主要因素有:各种测量数据,地图和遥感数据等的误差;调查和统计造成的属性数据误差,以及文档数据的错误等,数字化前的预处理、手扶踀自动化的分辨率和矢量化精度。

1、遥感数据

地理信息系统、遥感和计算机辅助制图是现代地理学的重要技术手段。遥感作为一种获取和更新空间数据的强有力手段,能及时地提供准确、综合和大范围进行动态监测的各种资源与环境的信息,因此遥感数据是土地信息系统的一个重要数据源。

所谓遥感(RemoteSensing)就是遥远感知的意思,也就是不直接接触目标物和现象,在距离地物几公里到几百里、甚至上千里的飞机、飞船、卫星上,使用光学或电子仪器接受地面物体或发射的电磁波信号,并从图像胶片或数据磁带形式记录下来,传送到地面,经过信息处理,判读分析和野外实地验证,最终服务于有关部门的规划决策[2]。土地管理部门可以运用遥感技术快速获取现状空间的信息。

尽管遥感技术有很多好处,但因其自身特性,获取的遥感数据可能存在一些误差。如:不同的高度引起的问题,由于传感器的结构及稳定性产生的问题,对信号进行数字化产生的误差。传感器在航线、航向上出现的误差,大气辐射产生的误差,地形和地貌等因素产生的误差等等。在遥感资料的获取时,有些误差是可以控制的,有些则不可控。因此必须对原始数据进行预处理,包括利用地面控制对原始数据进行几何校正,图像增强和分类。对获取的遥感数据进行光谱校正,特征提取,自动识别分类、自动成图等处理[3]。

2、测量数据

各种原始的测量数据是土地信息系统的主要来源之一。包括宗地的权属界线、位置、形状、数量、面积、各级行政界线、地形图测量等。由于人和环境的因素,测量数据不可避免地受到人为误差(对中、读数、平分等误差)、仪器、环境的影响。来源于地面测量的数字数据中含有控制测量和碎部测量误差。其中控制点误差又受控制网的参考基准、网形和观测精度以及观测费用等因素的影响。碎部点误差除了继承了控制点的误差外,还受自身观测方法,观测精度和地界的人为判断,以及地物地貌的取舍等因素的影响。当然原始数据误差受观测仪器、观测者和外界环境三种因素影响。除此之外,还有测量数据的实时性以及数据老化,采集数据的密度不合理,或概括取舍不合理,选取测量规范标准不一致或精度等级不一致造成测量数据的不一致的影响。

地籍要素是构建土地信息系统极为关键的一步,其测量数据的精度高低决定了系统功能能否得到正确和充分发挥。

从地籍测量成果的有效性和土地管理的可能性来考虑,为了保证各权属单元之间的界线清晰,边界无争议,并且双方都能接受而不损害他人和国家的利益,地籍测量要达到一定精度。因此,必须要有相应的数据采集方法作为保证。地籍要素的采集方法目前主要有两种,一种是传统的模拟式外业测图方法,另一种是野外全数字化数据采集方法。传统方法的主要作法是在地籍控制测量的基础上,用解析法测量出权属界址点坐标,以控制点或以界址点为基础施测成地籍图,要形成入库数据信息,则要通过对原图数字化来实现。用传统数据采集方法形成地籍要素数字信息其误差影响因素较多,主要误差来源为:测站点误差m1,量距误差m2,在测图板上描绘方向线误差为m3,刺点误差m4,数字化仪采点误差m5等。按有关专著论述,一般情况下,m1≈±0.12mm,m2≈±0.2,m3≈±0.1mm,m4≈±0.14mm,这四项误差为野外采集误差。数字化m5的影响因素比较复杂,误差产生首先与图形要素有关,要素本身的复杂程度对数字化精度有显著影响,数字化仪本身的精度更应引起重视。正常情况下,用常规数字化仪进行数字化时,精度一般可达到±0.13mm。综合上述得,地籍要素采集精度m采为:

m采=±

=±0.02mm

按1:500比例尺来考虑,实地误差将达到±10cm,由此可见,按传统方法施测,则拟入库的地籍要素信息很难达到规定的±5cm的精度标准[4]。

采用野外全数字化方法,界址点野外数据采集一般采用直接测定坐标法,即将全站仪或测距仪置于测站点上,对界址点上的移动棱镜进行水平角和距离测定,电子手薄记录计算。此种方法的主要误差来源为水平角测角误差mβ和测距误差mD,测角中误差角保守为±5″,测距误差主要来自移动棱镜偏离界址点位置误差,其偏离值按2cm考虑。测距平均边长取100m,按点位误差精度估算公式m2=来计算,则m≈±2cm,即便考虑测站误差和其他偶然的联合影响,点位精度也肯定在规定范围内,所以地籍要素信息数据的野外全数字化有利于提高界址点精度,从而保证地籍数据的质量。

3、调查、统计、文档数据问题

土地信息系统的建设过程中,涉及大量的调查统计数据,这些资料尚存在许多不足之处,为土地信息系统的建设带来了一定困难。

建立土地信息系统,必须首先进行土地基本信息的搜集,开展地籍调查工作,核实宗地权属,掌握土地利用状况,获得宗地位置、形状及其面积的准确数据,为建库奠定基础。

现就地籍调查工作加以探讨,众所周知,权属调查的工作之一是填写地籍调查表。由于权属调查技术性强,工作量大,参与人员多且水平不同等原因,填写后的地籍调查表或多或少会出现下面一些问题。在填土地使用者名称时,单位本应填写全称,可出现了类似这样的情况:某林业局有3宗地,而在3份地籍调查表上出现了xx林业局、县林业局、林业局等名称。按这样的名称录入建立信息系统,将导致不能正确地自动的归户。在填写土地使用者性质时,本应该写“全民”或“集体”或“个体”或“个人”,而出现了“国营”或“国有”或“私营”这样的名词。在填写宗地四至时应说明权属界线所经地物名称及归属、位置、与誰接壤。但出现了东(南、西、北)至xx,而未填出接xx。且有的四至填写错误,如两宗地共用一堵墙时,则只能出现两宗都至墙中,或一宗至墙内另一宗至墙外,但填出了两宗都至墙外或墙内等情况。在填写界址标示处的界址线位置时也有类似错误,有的表填写字迹潦草,或使用简化字,让人难以辨认。有的内容还可以猜出,但户主的姓名、调查员、勘丈员的签名等内容实在难辩;有的表中该填的内容而未填,任意涂改。

共用宗的处理,一个地块被几个权属单位共同使用,而其间又难以划清权属界线,这样的地块称为共用宗[5]。不少县(市)是这样处理的:有多少土地使用者就填多少份地籍调查表,表上的内容按各分宗填写。这样做的好处是所填的内容详细,调查表和土地登记申请书、审批表形成一一对应的关系。但其弊端也是显而易见的,其一较大地增大了填表的工作量,其二增大了复杂程度,在填写四至时,如遇一个土地使用者使用几个地块则不得不写清几个地块的四至;为填清界址指标,又得设置内部界址点,增加了宗地草图和地籍图的负荷量,填表时如不小心还会造成表与表之间的相互矛盾。为了和地调表统一,有的在形成宗地界址点成果表时,除了有宗地界址点成果表外,还有分宗的界址点成果表。如果内部界址点是在纸图上图解的,则将该宗地的宗地界址点和内部界址点和计算机展点后,会出现界址线混乱的情况。在土地信息系统建库时,这些内部点是不能当界址点录入进库的。如进库则在面积统计时,这种内部界址点所围成的区域的面积就被多统计了一次。

建立完备的信息系统,必须具备这样的条件:大比例的地形图或地籍图;野外测量的界址点数据;宗地的属性数据(土地登记申请书、地籍调查表、审批表等)。全省在进行大大规模的城镇地籍时,由于受当时的条件限制,自动化程度低,各作业单位作业水平的不同,或多或少出现一些问题。在建库时所发现的问题主要是界址点的坐标成果与地籍上的位置不吻合;相邻宗的同一界址点坐标不同;界址边长、宗地面积计算有误。某些县(市)为了进行土地登记,由于多方面的原因,在进行初始地籍调查时,只作权属调查,不作规范的地籍测量。为了计算面积,用皮尺或钢尺丈量界址边长及相关尺寸,用几何图形法计算出宗地面积,而不测址点坐标和地籍图。这样做不利于信息化的管理。

4、图形数字化

影响数据质量的因素是多方面的,有相当一部分来自于建库过程中的数字化过程。建库过程中的数据质量,包括数字化前的预处理,纸张变形、手扶跟踪数字化精度或扫描数字化的分辨率和矢量化精度。

(1)数字化前的预处理

用于数字化作业的地形图(工作底图)一般采用聚酯薄膜图,其变形一般小于0.2‰。采用纸质图纸时,图纸的尺寸随湿度和温度的变化而变化,温度不变的情况下,温度由0%增至25%,则纸的尺寸可能改变1.6%[6]。因为纸的膨胀率和收缩率不相同,即使温度回到原来的大小,图纸也不能恢复原来的尺寸。因此在数字化时要适当的比例因子,通过仿射变换进行几何纠正,以减小工作底图变形产生的位置误差,达到相应的精度。

对不同种类和比例的工作底图进行数字化时,应注意它的投影方式是否一致,比例是否匹配。对于不同投影方式应在数字化后及时变换为系统要求的投影方式。对于不同比例应将比例尺和精度记录到元数据中,以便估记由此可能产生的误差。

(2)跟踪数字化

手扶跟踪数字是一种自动化精度较低的数字化方式,其数字化精度也因操作员及其工作的疲劳程度而异,操作员的劳动强度较高。随着大幅面扫描仪的成本不断降低,扫描和矢量化技术不断完善,这种数字化方式可能成为自动扫描数字化的一种补充。

手扶数字化是从地形图输入空间数据的最广泛采用的输入方法。把地形图放置于数字化桌上,用手持设备,跟踪每一个地图特征、数字化设备精确量测鼠标的位置,产生数据形式的坐标数据。

影响跟踪数字化数据质量的因素很多;主要有:数字化底图中地理要素的宽度、密度和复杂程度对数字化结果的质量有着显著影响。数字化仪的分辨率和精度对数字化数据质量有着直接的决定性的影响。《地形图数字化规范》规定,数字化仪的分辨率不能小于每厘米394线(约1000dpi),精度不低于0.127mm(0.005英寸)。常见数字化仪在分辨率方面通常能满足要求,而在精度方面却有相当一部分不能达到要求。在选择数字化仪时要特别注意其精度指标,以满足LIS工程的需要。数字化操作员的技能与经验不同而引入的人为因素误差是不同的,由于操作员视力、操作习惯,熟练程度和疲劳程度的不同,最佳采样点位值判断,十字丝与目标点重合程度的判断会有一定程度的差异,影响数字化的质量。操作方式(如曲线采点方式和采点数目)也会影响数字化数据的质量。

假定各种误差影响符合误差传播规律,手扶跟踪数字化的综合精度应按下式求得:[7]

m数=±

其中:m数表示手扶跟踪数字化的综合精度;m定表示工作底图定向误差,m仪表示数字化仪精度,m人表示人为因素误差。

(3)、扫描数字化

扫描数字化用高精度扫描仪将图像等扫描并形成栅格数据文件进行处理,将之转化矢量图形数据。规范规定:图形定位控制点扫描误差不大于0.1mm,相对于工作底图,矢量化后的扫描点误差不大于0.15mm,线划误差不大于0.2mm。影响扫描数字化质量的因素除原图质量外,还包括:扫描精度、定向精度、矢量化精度损失等。

①扫描仪的分辨率和精度

扫描仪的分辨率和精度对扫描数字化质量的影响是至关重要的。因此,要根据具体情况选择适当的扫描仪。目前,大幅面扫描仪大致有,滚筒式(drum),平板式(flatebed),直进式(directfeed)3种。这些扫描仪能够输出一种或多种形式栅格数据文件(二值、灰度和彩色)。

滚筒式扫描仪精度较高价格较贵,能以较高的分辨率扫描AO或更大的图纸。

平板式扫描仪与滚筒式一样精度高、价格贵、分辨率很高,但一般幅面不会超过A1幅面。由于平板式扫描仪幅面小,扫描后多需进行拼接,从而增加了工作难度,引入了更多的误差源。LIS工程一般不选用这种扫描仪。

直接式扫描仪精度较低,价格也较便宜。通常能够满足一般LIS工程的需要。

目前,需要的大幅面扫描仪品牌有:CONTEX、VIDER、ANATECH等。

在选择扫描仪时,应注意其是否采用硬件消蓝。光学分辨率代表了扫描仪的分辨率能力,而经销商往往只是给出插值分辨。同时,应注意扫描仪的歪斜失真,歪斜失真的大小与扫描仪的走纸方式有关。

②栅格数据矢量化的精度损失

在土地信息系统中,栅格数据与矢量数据各具特点与适用性,为了在一个系统中可以兼容这两种数据,以便有利于进一步分析处理,常常需要实现两种结构的转换。

栅格的矢量转换处理的目的,是为了将栅格数据分析的结果,通过矢量绘图装置输出,或者为了数据压缩的需要,将大量的面状栅格数据转换为由少量数据表示的多边形边界,但是主要目的是为了能将自动扫描仪获取的栅格数据加入矢量形式的数据库。

在栅格数据矢量的过程中的细化、跟踪等均可能引入一些误差。复杂图形全自动化矢量化效果极差,会产生众多的交叉线,导致多边形跟踪错误。对此,应采用交互式矢量化方法。因此在选择矢量化软件时不应仅仅关心自动化程度(全自动矢量化软件价格往往很高)。还要特别注意是否具有以下功能:智能去斑,裁剪,扭曲较正,比例控制,水平校正,光栅编辑和交互式矢量化等。

③扫描数字化方法误差

扫描数字化的几何分辨率是扫描数字化方法误差中最重要的误差源,减小这种误差的唯一方法就是提高扫描仪的几何分辨率。但是,随着分辨率的提高,栅格数据量以平方级速度增长。这往往造成计算机存储资源耗尽,数据处理时间平方级延长。以300dpi(约每mm12个点)的分辨率扫描时,独立点间距离的相对精度为1.4/1000左右。全自动矢量化细化过程所产生的点位误差为1~2个像素点,而交互跟踪矢量化最大点位误差可以控制在一个像素点。按300dpi计,每个像素点相当于图上0.01mm。扫描数字化综合精度可按下式计算:

M扫=±

其中:M扫表示扫描数字化的综合精度;M定表示底图定向误差;M仪表示扫描仪精度;M矢表示矢量化误差。这里,M定取±0.12mm,按300dpi计算M仪取±0.09mm,M矢取±0.1mm。则M扫=±0.180[8]。

四、数据处理质量

土地信息系统的数据库建立后,其中已经包含了数据源和数据库建库所引入的误差。数据库中的多源数据,经过系统的各种分析处理后,在形成新的数据和最后产品的过程中还会产生新的数据质量问题。这些问题包括:几何改正,坐标变换和比例变换,几何数据的编辑、属性数据的编辑、空间分析,数据格式的转换等。

1、空间分析

空间分析是对分析空间数据的技术的通称。从客观上区分,可归纳为:空间的图形数据的拓扑运算;非空间属性数据的运算;空间和非空间属性的联合运算等[9]。空间分析赖以进行的基础是空间数据库,土地信息系统的空间数据分析,是实现土地资源信息系统的实际运用的重点途径。

空间分析中的叠加分析是土地信息系统中十分常用的一种分析方法,是用户经常用以提取数据的手段之一。通过同一地区不同内容的多幅地图的叠加组合,产生新的图形和属性信息。在这个过程中往往产生拓扑匹配、位置和属性方面的数据质量问题。由于叠加时多边形的边界可能不完全重合,从而产生若干无意义多边形。对这些无意义多边形进行处理的结果往往会改变界线的位置,叠加后形成的新的多边形的属性值也可能存在由于属性组合带来的误差。

2、坐标变换

土地信息系统数据来源较多,各种数据输入信息系统应便于系统对数据进行图形显示,叠加查询,统计分析处理。LIS要实现这些功能,一个首要和基本的前提就是各种不同来源的数据在系统内必须在一致的地形图坐标系下。但是,在实际的数据采集过程中,大量的数据坐标并不一定属于系统用户所要求的坐标系,原始数据为一种坐标系,系统要求的数据为另一种地图坐标系,有的数据坐标根本没有地理意义,对此情况,必须提供从一种地图坐标系到另一中坐标系的坐标变换。

在具体的操作过程中,有可能产生新的误差。在不同比例尺下对坐标数据的重新设立产生误差,进行投影变换和/或基准面变换时产生的误差。生产实践中为提高数据质量,确保系统的数据精度和可靠性,通常用仿射变换和相似变换等模型来进行数据处理,以减小或消除误差。

坐标变换的实质是建立两个平面点之间的一一对应关系,现有一般GIS(LIS是GIS的专题)软件大都提供了以下两种模型实现坐标变换。

一是仿射变换:仿射变换也称六参数变换,其变换公式为:[10]

x´=Ax+By+C(Ⅰ)

y´=Dx+Ey+F(Ⅱ)

其中,x´、y´为地图输出坐标系中的坐标点对;x、y为输入坐标中的坐标点时;A,B,C,D,E,F为方程参数。参数在坐标系空间上的几何意义为:A和A分别确定点(x,y)在输出坐标中x方面和y方向上的缩放尺度。B和D确定旋转角度,C和F分别确定在x方向和y方向上的水平移尺寸。

二是相似变换:当式(Ⅰ)、(Ⅱ)中的参数满足条件A=E=Scos@,B=-D=Ssin@时,则得到四参数的相似变换公式:

x´=Ax+By+B(Ⅲ)

y´=-Bx+Ay+D(Ⅳ)

式中,x´、y´为输出地图坐标系中的坐标点对;x、y为输入地图坐标中的坐标点对;A、B、C、D为方程参数,相似变换实质上也是坐标系间的平移,旋转和缩放尺度的变换,式中C和D分别为坐标在x轴和y轴上的平移大小,为缩放比例,@=arctg(B/A)为旋转角度。

为了求出以上公式中的参数,建立两种坐标之间的仿射(或相似)转换关系,至少需要三个(或两个)已知的控制点坐标。而实际上,应选择多于三个(或两个)控制点,方能按照最小二乘法原理进行平差,得出系数值,代入上述方程即建立输入和输出坐标系之间的仿射(或相似)变换数学模型。

可以看出,仿射变换和相似变换都为线性函数变换模型,可实现对原图形的平移、旋转和缩放,相比较而言,相似变换不能进行x轴、y轴不均匀缩放的变换,而仿射变换能保证更高的数据精度。

3、数据变换

(1)CAD向GIS的转换

目前我国土地管理中存在一个较为普遍的问题是土地信息系统的构建与图形数据采集较少作用一个整体来通盘考虑,地籍测绘大大超前于信息管理系统构建。中小城市这种问题表现得更为突出。为满足土地确权发证,土地定级估价等需要,1995年前测绘的地籍图等图件因受技术条件的限制绝大部分是采用传统白纸测图方法完成的。随着计算机技术的发展和在测绘工作中的普及应用,1995年之后数字地图逐渐取代传统测绘。但一个不容忽视的事实是,绝大多数测绘图软件是在AUTOCAD上进行二次开发完成的。有些甚至是采用低版本的CAD,有些测绘图软件虽然测的是数字图,但只有非编码的图形文件,不保留信息,或者图形编辑以后,返不成信息。这种数字图说到底仅仅是从传统的白纸图过渡到计算机驱动绘制的白纸图。本质上与传统测绘没有什么区别。有些虽然采用了较高版本的CAD基础软件二次开发成数字测图软件并采用了数字编码技术,但由于较少考虑CAD与GIS的数据共享问题(土地信息系统属于专题GIS)。在着手考虑构建土地信息系统时,遇到的突出问题则是如何充分,有效利用已有数字信息资料,并确保数据转换质量。

对于传统模拟图或难以返成信息的所谓数字图只能采用原图数字化,形成数字信息后方可加以利用,但其精度丢失是不可避免的。

对于采用了编码技术,也能返成信息的数字图,其数字信息可以通过数据转换来实现数据共享,但由于CAD与GIS图形数据之间其数据格式,数据内容甚至数据概念都有很大差异,数据转换时应注意以下三个方面:[11]①数据格式转换。不同的软件有不同的数据格式,有些可以通过通用数据格式如DXF实现转换,但转换过程中的数据丢失也的确令人烦恼。②数据元素转换。CAD与GIS两者之间的图形元素不是一一对应关系,CAD图形中的图形元素种类要比GIS图形文件中的图形元素种类多,GIS中只有点、线、面三类基本图形元素,而CAD中包括有点、线、面、注记、矩形等多种图形元素,在具体转换中,CAD的图形元素哪些转换成GIS的点,哪些元素转换面面,什么元素需要转换成GIS的属性数据,什么元素则不需要转换到GIS中去等。CAD与GIS图形元素之间的对应关系,都需要认真细致地加以技术处理,使空间数据和属性数据在输入系统后正确地连接起来。③拓扑关系的形成。因为CAD的图形元素之间没有拓扑关系,实现CAD向GIS数据转换的一个重要内容就是要将转换后的图形数据按照一定的技术要求经过编辑,在GIS环境下建立几何元素的拓扑关系。

在实际转换中,还会出现许多意想不到的技术问题,会影响数据转换质量,有待进一步解决。

(2)矢量数据结构向栅格数据结构的转换

土地信息系统的建设中,许多数据如行政边界,交通干线,土地利用类型、土壤类型等都是用矢量数字化的方法输入计算机或以矢量的方式存在计算机中,表现为点、线、多边形数据。然而,矢量数据直接用于多种数据的复合分析等处理将比较复杂,特别是不同数据要在位置上一一配准,寻找交点并进行分析。相比之下利用栅格数据模式进行处理则容易得多。加之土地覆盖的叠置复合分析更需要把其从矢量数据的形式转变为栅格数据的形式。

矢量数据的基本坐标是直角坐标(x,y),其坐标原点一般取图的左下角。网格数据的基本坐标是行和列(i,j),其坐标原点一般取图的左上角。两种数据变换时,令直角坐标x和y分别与行与列平行。由于矢量数据的基本要素是点、线、面,因而只要实现点、线、面的转换,各种线划图形的变换问题基本上都可以解决[12]。

矢量数据变成栅格数据的原理与方法并不困难,但由于矢量数据的记录方式各不相同,也会产生一些问题。如多边形之间公共边原来只有一条交界线,转变成网格后成为有一定宽度的界线,产生了一定的近似性。特别是几条线交叉处,一个网格元素中包括了相邻的几种类别,转换时只能用其中的一种类别作为交叉点所在的元素的类别,这种误差应在允许的范围以内。而减小网格尺寸,虽提高了精度,但大大提高了数据的冗余量。

栅格数据结构需要大量的计算机内存来存贮和处理数据,才能达到与矢量数据结构相同的空间分辨率,而矢量结构在某些特定形式的处理中,如象多边形叠置,空间均值处理等尚有大量的技术问题来解决。值得注意的是,无论采用哪种转换方法,转换的结果都会不同程度地引起原始信息的损失。

通过矢量数字化或扫描数字化所获取的原始空间数据,都不能避免地存在错误或误差。属性数据在建库时,也难免会存在错误。诸如:空间数据的不完整或重复,空间点、线、面数据的丢失或重复,区域中心点的遗漏,栅格数据矢量化时引起的断线等,空间数据位置的不准确、线段过长或过短,线段的断裂、相邻多边形结点的不重合及空间数据的变形等。因此,必须对图形数据和属性数据进行一定的编辑。

土地信息系统数据编辑是消耗时间的交互处理工作,对空间数据不完整或位置的误差,主要是利用LIS图形编辑功能,如删除(目标、属性、坐标),修改(平移、拷贝、连接、分裂、合并、装饰)、插入等进行处理。对空间数据比例尺的不准确和变形,可以通过比例尺变换和纠正来处理。

在数据的编辑过程中,由可能产生一些新的问题。如:线段的相关与延伸出现的问题,图形的平移与旋转出现的问题,删除“细部多边形”时产生的误差,数值计算与变化的误差;文件的合并以及形成新文件的问题;属性数据的重新定义和更新的问题。有的问题时可能避免的,有的问题则无法避免。因此,必须进行检核。通过耐心细致的检查,主要误差都能从数据中寻找出来,并有效消除误差。一般采用叠合比较法,目视检查法和逻辑法。

叠合比较法是空间数字化正确与否的最佳检核方法,按与原图相同的比例尺把数字化的内容绘在透明材料上,此后与原图叠合在一起,在透光桌上仔细的观察和比较。一般。对于空间数据的比例尺不准确和空间数据的变形马上就可以观察出来,对于空间数据的位置不完整和不准确则须把遗漏、位置错误的地方明显地标注出来。目视检查指在屏幕上用目视检查的方法,检查一些明显的数字化误差与错误,包括线段过长或过短,多边形的重叠和裂口、线段的断裂等。

5、由计算机引起的问题

在计算机中,数据是由一定字长的编辑数码表示的,由计算机字长可能引起一种误差。这种误差出现在各种数值运算和模型分析中,由这种误差引起的问题很多[13],例如LIS空间数据库中整数编码对面积和周长计算的影响,比例尺变换和旋转变换对拓扑关系的影响等。削弱误差影响的主要方法有:改变数据在计算机中的表示方式,采用合适的算法等。

除了数据处理精度外,数据存储精度也与计算机字长有关。16位的计算机在存储低分辨率的栅格图像时不会出现问题,但存储高精度的控制点坐标或点位精度要求高的地理数据时,则不能胜任。

五、数据应用质量

土地信息数据在使用过程中往往出现一些质量问题,这些问题包括数据的完备程度,时间的有效性,拓扑关系的正确等。

1、数据的完备程度

数据的完备程度指地理数据在范围、内容、及结构方面满足所有要求的完整程度。包括数据范围、空间实体类型、空间关系分类、属性特征分类等方面的完整性。

一般来说,空间范围越大,数据的完整性就越差。在土地信息系统的建库过程中,数据不完整最简单的例子是缺少数据。如计算机从GPS接收机传输位置数据时,由于软件受干扰或其它因素的缘故,只记录下经度而丢失纬度,以至造成数据不完整。另外由于GPS接收机无法收到四颗或更多的卫星信号而无法计算高程数据也会造成数据的不完整。又如某个应用项目需要1:5000的基础底图,但现在的地图数据只覆盖项目区的一部分,底图数据便不完整。

在土地信息系统底建库中,涉及大量的地籍档案。地籍档案来源于土管机关的地籍部门,数量大、形式多、浩繁、零乱,随着时间地推移,以及人为和自然的各种因素地影响,有可能遭到损坏。如档案老化,书写材料低劣、地籍档案变到污染,变色、虫蛀等现象,进而影响到整个系统的质量。

2、数据的现势性

数据的现势指数据反映客观现象目前状况的程度。数据的现势差,反映的客观现象就可能不准确。不同现象的变化频率是不同的。如地形的变化一般来说比人类建设要缓慢,地形可能会由于山崩、雪崩、泥石流、人工挖掘及填海等原因而在局部区域改变。但由于地图制作周期较长,局部的变化往往不能及时地反映在地形图上,对那些变化较快的地区,地形图就失去了现势性。城市地区土地覆盖变化较快,这类地区土地覆盖图的现势性就比发展较慢的农村地区会差些。地形图上记录着所用航空像片获得的年代。若又用其他数据进行过修改(一般是较新的航空像片),也应记录于上。

在土地信息系统建库中,要求地籍信息和地籍图必须具有现势性。地籍信息变更比较频繁,如土地利用类型,权属或宗地的重划,合并等。由于受自然因素和人为作用的影响,土地资源的数量、质量、分布和使用情况都处在经常变化之中。基于这一特点,土地管理部门提供的数据很难保证现势性,这也是影响数据质量的一个重要方面。

3、拓扑关系

在LIS中,为了真实地反映地理实体,不仅要包括实体的位置、形状、大小和属性,还包括必须反映实体之间的相互关系,这些关系就是指它们之间的邻接关系,关联关系和包含关系,拓扑关系。拓扑关系的核心是建立点、线、面的关联关系。通常有以下几种空间关系:点-点关系、点-线关系、点-面关系、线-线关系、线-面关系、面-面关系。空间数据的拓扑关系,对数据处理和空间分析具有非常重要的意义[14]。

利用拓扑关系,可以确定一种空间实体相对于另一种空间实体的位置关系。利用拓扑关系,可以确定某县有多少耕地,分析土地利用类型及对土地适宜性做出评价等。

在拓扑关系的建立中,拓扑过程中伴随有数据所表达的空间特征的位置坐标的变化,拓扑关系的不正确等情况,导致空间分析的结果错误,给土地管理决策带来一定的影响。

六、结论

数据是LIS最基本和最重要的组成部分,同时也是一个LIS项目中投资比重最大的一个部分。数据质量的好坏,会直接影响到LIS的系统功能和应用质量问题的三个方面(数据源的质量问题、数据处理质量问题、数据应用质量问题)着手,对LIS的数据质量问题进行了一定的归纳总结和初步的探讨。众所周知,LIS的数据质量是影响LIS的一个瓶颈环节,LIS数据量大、数据种类多、数据结构复杂。因此,在LIS的建设过程中,如何在数据采集与建库中实施质量控制,保证数据质量对土地信息系统建设来说显得尤为关键。

七、总结与体会

毕业论文的撰写是一次再学习和锻炼的机会,是对所学知识的一个融会贯通的过程。通过毕业论文的撰写,我对所学的知识有了更深层次领悟和掌握,对自己所学的土地管理专业有了一个整体认识。毕业论文不仅是对所学知识的总结,也是运用所学知识探求新知的方法、手段。既是一次再学习的过程,也是一次深入学习的机会。同时,毕业论文写作,为今后的学习工作奠定了一定的基础。通过毕业论文的写作,我真正懂得理论联系实际的重要性。在撰写毕业论文中,我运用所掌握的基本知识、方法和技能,研究探讨了土地信息系统建立过程中数据质量的有关问题。通过毕业论文的撰写,我进一步完善了自己的知识结构,学习了更多的知识。不仅如此,我对土地信息系统数据质量控制措施与方法方面有了更进一步的认识。

通过毕业论文的写作,不仅强化了我的学习素质、研究素质和创业素质,而且培养了我的创新意识,激发了我探求新知的欲望。认真写作毕业论文,不仅能进一步巩固所学的理论知识,而且还能进一步提高自己的各项基本技能,实践能力和解决问题的能力。

八、谢辞

在论文的写作过程中,玉文龙老师给予了很大的支持和帮助,为论文的写作提出了许多宝贵性的意见和建议;在他的指导下,这篇论文得以顺利完成。在资料的搜集过程中,图书馆工作人员为我们提供了很大帮助,本组同学也给予了很多支持,在此表示衷心感谢。

参考文献

[1]钱乐祥,余明全.土地信息系统的几个基本问题.测绘通报,1999(10).

[2]张超等.地理信息系统.北京:高等教育出版社,1995.

[3]阎正等.城市地理信息系统标准化指南.北京:科学出版社,1998.

[4]范爱民,景海涛.地图数字化质量问题.测绘通报,2000(4).

[5]严星,林增杰.地籍管理.北京:中国人民大学出版社,1999

[6]-[7]郝向阳等.地图扫描数字化点位精度分析.测绘学报,1995,25(1).

[8]毛锋等.地理信息系统建库技术及应用.北京:科学出版社,1999.

[9]汤国安,赵牡丹.地理信息系统.北京:科学出版社,2000.

[10]徐建刚.城市规划信息技术开发及应用.南京:南京大学出版社,2000.

[11]司少先.地籍信息系统源数据质量问题探讨.测绘通报,1999(4).

[12]边馥苓主编.GIS原理与方法.北京:测绘出版社,1996.

数据信息论文第3篇

1.1恶意的对计算机进行攻击伴随着计算机的软件发展,各种方面的软件、硬件都在出现和更新中。作为计算机最基础的数据统计等功能也进入了开放性越来越强的变新中。在医院的SQL数据库中使用的是局域网,在这个局域网里面的用户基本都可以访问到数据库及应用系统。这样的互享模式如果是在医院内部倒也没什么,只是各种恶意的软件横行,会导致不少来自外界未知的恶意软件对医院的计算机进行攻击。这些都给医院的信息管理系统的安全造成了极大的威胁。一旦医院的数据库信息被泄露,从收费的数据到医疗的信息、从病人隐私的保密到管理信息保密都会处于一个透明的状态,这对于医院的信息管理是一个巨大的冲击,也会带给病人一些重大麻烦。为了避免这类事情发生。需要医院信息管理系统和数据库处在非常安全的环境里。这也是本文研究基于SQL数据库的医院信息管理综合应用平台设计的重心。

1.2被动的进行攻击在不影响正常网络使用的情况下,还会有更高明的窃取破译数据库的方法,这也是所谓的被动的进行攻击。在这种窃取、破译的行为下,当事人医院数据库很难查悉这行为,因此会造成非常重要的机密性文件数据的泄露。医院的数据库是整个医院信息系统的灵魂,很多黑客病毒都会以此为突破点以获得很重要的机密数据。无论是主动的还是被动的攻击方式,都是现今使用的SQL数据库系统的抖动,为了保证医院的计算机信息安全,保证医院和病人的隐私,有必要针对这些缺陷进行改进。基于SQL数据库系统的综合信息应用平台设计可以更贴近实际,防止人为恶意的网络安全的攻击。这也是医院今后采用SQL数据库进行工作时的防范重点。

2SQL数据库在医院信息管理综合应用中的完善

2.1根据具体的需要相应的增加或者减少相应的模块数量医院和个人可以根据自己的具体需要,进行一些简单的维护,将系统的模块进行增加或减少。并且在增减模块的同时注意维护编程的界面,这样才能设计出很友好的系统模块。有了针对性的结构特点,这样的数据库应用平台不仅更符合医院信息管理系统的设计,而且还增大了独立性和独特性,因此也可以整体提高系统的可维护性和可靠性。选用这样模块化的SQL数据库应用平台也是设计结构的特点。

2.2采取开发式结构特点研究基于SQL数据库的医院信息管理综合应用设计就必须要仔细斟酌这数据库的系统硬件的结构设计。这个也是整个信息系统的核心内容。当前采取的数据统计模式执行的是TCP/IP的协议。如果要进一步加强系统给的可靠性,保证医院和病人信息的安全就应当采取开发式结构特点的系统硬件结构设计。采取这样的硬件结构设计可以减少冗余的配置,保证系统可靠性。在整体的医院数据信息系统中,最重要的就是这个系统。在完善机遇SQL数据库的应用设计时自然需要通过增强系统给的整体可靠性,以联合增强SQL数据库的互联网安全机密新能。SQL依然可支持远程的访问,这也是医院信息数据库需要有的特点。因此,虽然可支持远程访问的功能会导致医院的信息保密功能不太安全,却也不能删除。但是可具体根据医疗方面的任务对应的增加远程访问的时间限制、地点限制和次数限制。这也是开发式硬件结构的特点。

2.3系统性能优化SQL数据库历经几年的研究和使用已经近乎完美,因此对数据库的性能进行优化是个非常困难的任务。然而,只要是实际工作有需要的,都应当做出针对性的系统性能优化。为了保证医院信息的安全,也为了保证医院工作的效率,系统性能优化的完善势在必行。在医院日常的工作中,最繁重的就是数据统计和索引了,若性能得到优化,就可以大大加快数据库的反应速度,这样也能使医院的工作和服务得到提升。

3结论

数据信息论文第4篇

大数据时代的到来,计算机信息处理技术也存在着很大风险,其中最突出的问题是计算机病毒以及恶意盗版软件等,给用户使用计算机产生了极大的消极影响。这些还是一些比较基础的问题,随着计算机技术的发展,还出现篡改数据、冒名顶替等问题,影响计算机技术服务质量,计算机信息处理技术受到了前所未有的考验。另外,大数据时代的到来,还出现了许多新型网络技术,针对一些繁琐的问题能够有效解决,提高了人们的工作效率,然而,这也在一定程度上降低了网络的真实性,特别是在网络交流和沟通日益紧密的前提下,导致网络信息真假难分,不仅增加了信息搜索难度,而且致使人们无法快速获得真实信息。因此,提高计算机信息处理技术至关重要。

2大数据时代计算机信息处理技术

2.1信息采集、加工方面

计算机信息处理技术要进行工作,首先,要采集数据信息,计算机技术都是建立在数据采集基础之上的,数据采集主要是针对目标信息源进行实时的信息监督和控制,并将才觉得数据储存在计算机数据库中,为各个软件提供信息支持,确保下一项工作顺利进行;其次,对数据信息进行加工,按照用户的要求,对数据信息进行加工;最后,将加工好的数据信系进行分类,最终传送到用户手中,实现数据采集、加工以及传送目标。

2.2存储方面

计算机存储技术是将采集的信息储存到计算机数据库之中,在用户需要某一项信息过程中,可以通过数据库直接将数据调取出来,计算机以其储存量大、速度快等优势,受到人们越来越多的关注,另外,计算机技术还能够实现长时间储存。

2.3信息安全方面

大数据时代的到来,让人们感受技术带来的便捷的同时,也让人们意识到数据信息安全对人们的重要性。因此,为了能够提高数据信息的安全、可靠性,可以通过以下几个方面进行:首先,建立计算机信息安全体系,加大专业技术人才的培养力度,投入资金,为构建计算机安全体系奠定坚实的基础;其次,加大研究力度,开发信息安全技术产品。传统信息安全技已经无法满足大数据时代数据安全需求,为了能够尽快改善数据安全问题,应加大研究力度,寻求更好的解决方案,有效避免数据信息受到威胁;最后,重视对重要数据的检测,大数据时代的突出特点是数据量大,无法实现对每一个数据的检测。因此,为了提高数据安全系数,应加强对重点数据信息的检测,从而确保数据信息安全。

2.4信息处理技术的发展

计算机硬件具有一定局限性,在一定程度上阻碍了计算机网络的发展,而云计算网络能够突破这一弊端。因此,推广和应用云计算机网络成为未来大数据时代计算机信息处理的主要发展趋势。传统计算机网络是将硬件与网络有机结合,抑制了计算机信息处理技术的发展,将二者分离开,促使云计算主筋形成云计算网络,从而构建大数据信息网络系统,推动我国社会不断发展。

3结论

数据信息论文第5篇

当前“大数据技术”充满了新的机遇和挑战,其在企业IT基础架构、数据管理、分析和服务这些关键规划领域的应用,将会对社会经济发展带来长远深刻的影响。大数据指的是从各种各样的数据中快速获得有价值信息的能力,具有数据量大、种类繁多、价值稀疏、处理速度快的特征,这些特征对目前社会各个行业的信息架构、系统的冲击非常大。大数据技术对整个社会经济发展来说既是机遇也是挑战。

(一)必要性

根据IDC在2011年6月的《数字宇宙》(DigitalUniverse)研究报告,2011年全球新建和复制的信息量超过1.9ZB(1.8万亿GB),五年时间增加了近九倍。随着数据量的指数级增长、数据源种类(包括结构化数据源和非结构化数据源,如社交媒体、富媒体文件以及地理空间信息)的飞速增加,以及数据产生速度的加快(如实时传感器数据),传统的数据库和架构无法处理、管理和分析如此庞大的数据集。政府、金融、电信、互联网等大数据应用的行业先锋目前均面临大数据的问题。不仅如此,随着物联网、云计算、移动互联网、车联网、智能手机、平板电脑的飞速发展,大数据技术拥有了更为广泛的数据资源。因此,IT产业界及行业用户都亟需针对大数据设计和优化大数据存储、管理和查询平台,来替代传统关系型数据库平台。在技术发展的前沿阶段进行实验平台建设对我学院师生具有重要意义。该实验平台能够为学生提供一个了解最前沿技术的机会,不仅能够提高学生学习兴趣、自学能力,还为学生就业、更好地规划未来的职业发展提供了机会。大数据技术的机遇与挑战带来了很大的人才缺口,目前大数据技术平台开发、方案实施人才紧缺;由于云存储、大数据技术带来的信息安全问题,也亟需大量信息安全领域的人才;由于大数据技术在物联网、电子商务、移动互联方面的应用,对了解大数据技术的电子商务专业人才也更青睐。通过本实验平台的培养,感兴趣的优秀学生还可以尝试考取与大数据技术密切相关的Hadoop专业认证———ClouderaCertifiedDeveloper/AdministratorforApacheHadoop,为学校、学院在该领域带来正面影响,增加更多合作和就业的机会。该实验平台能够为信息系统专业试点班培养计划的很多核心课程(包括管理统计学中的业务报表与分析、商务智能方法与应用、商务智能实践、数据挖掘和BA综合实训等)形成较好的前后衔接关系,能够丰富实践教学环节,深化教学大纲的内容,从建设更合理的课程建设体系来说具有很大的必要性。近几年学生就业压力越来越大,迫切需要对教学内容和实践环节不断突破创新,才能具备持续发展能力。因此在原有课程体系和实践教学环境的基础上增设本实验平台非常必要。

(二)可行性

教学计划中的相关程序设计课程为学生学习云存储技术、熟悉大数据开发平台、了解最新大数据技术的发展、进行大数据平台基础上的开发、实现对大数据的分析、可视化演示打好了基础。英特尔ApacheHadoop平台是目前大多数大数据处理的技术基础,目前该技术已经发展成熟,并随之产生很多基于该平台的大数据处理工具,可供实验室建设实验平台使用。

二、建立大数据实验平台的基本构想

(一)实验平台人员

实验平台人员负责实验平台的建设、维护,实验设计与指导人员由在大数据相关领域、课程建设以及实践教学方面都有着丰富的经验的教师与实验室工作人员构成,同时与大数据企业进行合作,获得其核心技术人员的支持、培训和大力配合,可以共同组成一个经验丰富、精炼实干的建设团队。

(二)软件调研

大数据的特点为4个“V”:第一,“Volume”,指的数据量大,包括大的数据块,或数据总量巨大,从TB跃升到PB;第二,“Variety”,指的是数据种类繁多,包含大量非结构化数据,例如网络日志、音频、视频、地理信息等;第三,“Value”,价值稀疏性,大量数据中有价值数据很少;第四,“Velocity”,指的是处理速度快,这与传统数据挖掘有很大区别。选择有数据分析基础、在业内发展领先的企业进行调研并选择适合高校规模的合作企业是建立实验平台的重要工作。很多公司给出了可供使用的大数据平台:IBM誖InfoSphere誖BigInsightsTMBasicEdition是一款基于开放源码ApacheHadoop的分析平台,用于分析大量本机格式的非常规数据,支持结构化、半结构化和非结构化内容,以实现最大程度的灵活性;IBM誖InfoSphere誖Streams是一个高级计算平台,帮助用户开发的应用程序快速摄取、分析和关联来自数千个实时源的信息;惠普公司Vertica分析平台6.1,能够通过Hadoop分布式文件系统连接器来优化大数据;ClearStoryData大数据分析新创公司,通过Clearstory,公司客户可以将自身的数据与行业的公共数据融合,寻找统计上的新视角,目标是取代目前市场上的主流数据可视化工具,包括QlikView和Tableau等老牌工具;Informatica9.1提供首款Hadoop编译器Hparse,这是一种针对Hadoop而优化的数据转换环境,该软件支持灵活高效地处理Hadoop里面的任何文件格式,为Hadoop开发人员提供了即开即用的解析功能,以便处理复杂而多样的数据源;Datameer:Hadoop海量数据分析平台允许用户在缺乏技术知识的情况下能够分析大量数据;Infochimps平台以其完备的基础设施和专业知识,为客户提供端到端的大数据解决方案,Infochimps是一家位于美国德克萨斯州奥斯丁的创业公司,2012年2月从数据市场转型为大数据平台提供商后获得谷歌投资;甲骨文大数据机———OracleBigDataAppliance集成系统融入了Cloudera的DistributionIncludingApacheHadoop、ClouderaManager和一个开源R;微软SQLServer新增PDW功能,可以帮助客户扩展部属数百TB级别数据的分析解决方案;亚马逊将MapReduce作为一项服务,其弹性MapReduce编程是一项能够迅速扩展的Web服务,运行在aws的亚马逊弹性计算云和亚马逊简单存储服务上;Teradata是企业级数据仓库(EDW)的领导者,在结构化数据、半结构化数据和大部分非结构化数据领域几乎没有很大成果,因此收购了AsterDa-ta———一家提供SQL-MapReduce框架的公司。AsterData是高级分析和管理各种非结构化数据领域的市场领导者和开拓者,为Teradata带来了大数据分析市场商机。

(三)方案实施

实验平台的设计同时立足于大数据技术的发展的前沿性与本学院学生专业特点,与学生前序的理论、实践课程均有良好的衔接,符合人才培养计划,深化了教学大纲的内容,并针对不同专业学生设计实践学时、内容和难度。本实验平台可以同大数据行业中的公司科研部门共同合作建设,双方确定在人才培养、师资培训、共建实验室和实训基地、推动大学生校外实习和社会实践活动的开展等方面开展全面、广泛、长期、深入的合作。该实验室建设将丰富实践教学体系,也可推动学院科研项目立项、新课题研究、专项基金申请和联合开展商用项目开发等;该实验室使师生能接触高新大数据开发平台,了解最新大数据技术的发展,进行大数据平台的开发,实现对大数据的分析、可视化演示,增强学生的动手能力并提升就业质量;与此同时,提升了教师的项目管理能力和教学能力。

三、结论

数据信息论文第6篇

数据挖掘的另一个主要的作用便是在处理企业的内部以及外部的信息的基础之上,对于涉及企业所有的信息进行整合以及筛选,最终目的是能够提供对于企业的发展有着重要作用的信息。通过对于企业的内、外部信息进行合并以及挖掘,找出企业的内部以及外部之间相关的影响的信息。从而实现企业的内外部信息的综合处理以及应用,在其中提取有价值的知识,并且增强企业的管理功能,提高企业的信息化管理的效率。

2数据挖掘在企业信息化之中的实际应用

企业的信息化的建设在企业之中是一项比较复杂并且需要长期的资金以及人力投资才能够完成的事情,企业的管理者需要从企业的自身出发,从而选拔经验比较丰富、技术水平较高、立场比较中立的主体对企业提供的数据进行诊断以及分析。数据挖掘本身与企业利润没有直接的关系,企业为了能够使得数据挖掘带来的效益表现在企业的利润之上需要进行一次有关于数据挖掘的循环:确定目标、选择数据集、数据挖掘、知识应用、计划执行、结果反馈。

2.1企业信息诊断阶段的应用企业的信息化的诊断阶段主要包括预备、正式以及总结三个部分。首先要对企业的相关的经营活动,无论外部以及内部都需要进行原始数据的收集,其中可以包括企业的产供销、研发过程管理以及外部经营环境等。然后整合到企业的数据库之中,根据数据挖掘需要达到的目标,编写数据挖掘需要的相应的数据算法,挖掘出相应的有价值的信息,从而为企业的发展战略、外部环境、企业文化甚至组织机构以及制度管理提供数据依据。

2.2在客户关系管理之中的应用数据挖掘之中非常重要的一点在于对于客户的自身的行为进行分析,客户的行为之中包括对于客户的满意程度、忠诚度、客户异常、客户保持等。在企业的经营生产之中,随着商业数据的不断增加,关于为了更好地服务客户进行的数据挖掘起着至关重要的作用。在对客户相关的数据挖掘之中,包含对于客户的识别以及评价,分析客户的相关行为的改变为企业带来的变化,从而使得企业与客户的关系达到最优。数据挖掘在客户的管理方面能够深化企业对于客户本身的管理,跟踪市场的变化,从而最终预测客户的消费趋势,最终开发出满足客户自身需要的个性化产品。

数据信息论文第7篇

近年来,数据挖掘与商务智能技术发展迅速,充分借鉴国外相关研究,尤其是ACMSIGKDD课程委员会对数据挖据课程建设建议,对进行数据挖掘类课程的教学建设研究有重要意义。ACM(美国计算机协会)于1998年成立了SIGKDD(知识发现兴趣小组),致力于知识发现与数据挖掘的相关研究,ACMSIGKDD课程委员会连续多年多次更新其主要课程———数据挖据课程的建议,其中委员会将数据挖掘课程分为基础部分与高级主题,基础部分覆盖了数据挖掘的基本方法,高级主题既有数据挖掘基本方法的深入研究,又有更高级算法的介绍。国外很多大学的计算机科学学院、商学院都开设了数据挖掘类课程并同时进行相关研究。波士顿大学开设了“数据管理与商务智能”课程,课程主要包括基础、核心技术、应用三部分。许多国外著名大学建立了教学管理系统,提供大量的案例、在线讨论和在线辅导功能。国内很多学校都开设了数据挖掘的相关课程,我国大多数高校的课程大纲内容与国外大致相同,只是在实践部分选用了不同的商务案例。数据挖掘的应用领域广泛,因此可以根据开课学院和专业选择合适的实例。

二、根据信息管理专业本科生培养要求确定课程目标

数据挖掘课程是一门综合性很强的前沿学科,对计算机软硬件、数据库、人工智能技术、统计学算法、优化算法等基础知识都有较高的要求。因此该门课程开设在学生大三下学期,既有相关知识的基础,又为大四做毕业设计提供了一种思路。信息管理专业是计算机与管理相结合的专业,旨在培养具备信息系统开发能力与信息资源分析与处理能力的综合应用型人才。对信息管理专业的学生而言,本课程主要的目标是数据挖掘算法原理理解、数据挖掘算法在商务管理问题中的应用以及常用数据仓库与数据挖掘软件的熟练应用和二次开发。

三、基于模块化方法的课程内容分析

模块化教学模式是按照程序模块化的构想和原则来设计教学内容的一整套教学体系,它是在既定的培养目标指导下,将全部教学内容按照一定标准或规则进行分解,使其成为多个相对独立的教学模块,且各教学模块之间可以按照一定的规则有选择性的重新组合。学生可以根据个人兴趣和职业取向在不同模块之间进行选择和搭配,从而实现不同的教学目标和人才培养要求。模块化教学本质上是以知识点与实践的细化为出发点研究的。商务智能方法本身非常丰富,实践应用也是课程的主要特点之一,因此十分适合使用模块化的知识分解方式。本课程的知识点模块管理分为两个层次,一是从宏观角度设计课程的基础内容模块和高级主题模块;二是从微观角度针对较为复杂的教学内容进行的知识点划分。

1.课程主要内容模块化分析。目前该课程包括十章理论内容,分别为数据仓库与数据挖掘的基本知识、数据仓库的OLAP技术、数据预处理、数据挖掘系统的结构、概念描述:特征化与比较、挖掘大型数据库中的关联规则、分类与预测、聚类分析、复杂类型数据挖掘和序列模式挖掘。根据模块化管理的宏观角度分类,课程内容的第一至五章属于基础理论部分和简单数据挖掘技术的介绍,可以作为基础内容模块;第六至八章为数据挖掘的核心算法,其中既有基础理论与技术方法,又可深入到较难的方法和复杂的应用,因此介于基础内容与高级主题之间;第九、十章可以算做课程的高级主题模块;另外,课程的实践模块既包含数据仓库的建设又包含数据挖掘算法的应用,难度也介于基础内容与高级主题之间。

2.复杂知识点的模块化管理。从微观角度对知识点进行设计主要针对的是上述的高级主题、以及难度介于基础内容与高级主题之间的章节,由于这些章节知识点在难度上有一定层次,讲授内容弹性比较大,因此需要在课程设计中明确一定课时量所要达到的难度。以商务智能技术中的分类算法为例:首先一般的入门课程都会介绍分类算法的概念和基本原理;接着开始介绍分类算法的基础算法———决策树,而决策树算法中又包含ID3等多种算法,并且除了决策树外,还有其他更高级的分类算法;在真正使用分类法进行预测时,还要分析预测准确度;最终要将所学知识加以应用。这样就形成了一个结构清晰、难度循序渐进的知识点模块的层次关系。在宏观角度、微观角度对教学内容进行分类的前提下进行相应的授课方法与考查方法的研究,才能真正有助于学生的学习。

四、授课与考核方法设计

对不同层次学生要求不同,这种不同既体现在知识点的要求上,又直接体现在任务的难易性程度上,这都需要教师在课程设计时充分考虑不同要求情况下的不同的授课方式,并使学生清楚自己需要掌握的程度。对于高级算法和实现部分,通常可以选择一到两章内容采用专题探讨式的教学方法。这种方法是指在教师启发和引导下,以学生为主体,选择某个基本教学单元为专题,学生自主研究作为知识传递的基本形式,将多种灵活的教学方式综合运用到教学环节的教学方法。根据信管专业培养方案的培养目标、以及对学生调研的情况,实践环节比较适合选择成熟的商务智能工具进行数据的整合和多维数据建模,也就是直接使用现成的;或者使用数据挖掘软件进行数据建模,完善数据挖掘算法。可以针对学生管理基础课与IT基础课知识的掌握情况,选择合适的工具为学生设计综合性实验。实验中给出部分操作步骤,并在实验后期仅给出数据与工具,让学生自己设计数据仓库、进行数据挖掘、并对挖掘结果进行多种形式的展示。

五、结论

数据信息论文第8篇

个人信息泄露与滥用,侵犯个人隐私并不是互联网所特有的现象。但进入互联网时代以来,个人信息复制、散播极其便捷,滥用个人信息给公众造成骚扰甚至伤害的现象普遍存在,侵犯个人隐私的事件也层出不穷,因而对个人信息进行保护以预防和制止滥用,保护网络隐私逐渐成为多数人的共识。个人信息被极端滥用的典型事件以2005年韩国发生女子因未清理宠物粪便导致的所谓“狗屎女”事件为典型,该事件是如今被称为“人肉搜索”的第一次公共事件,因个人信息被公布,当事人受到巨大影响,退学、搬家直至罹患精神疾病都难以摆脱困扰,是导致韩国一度实行网络实名制的标志性事件。侵犯网络隐私也很普遍,具体表现则与个人信息有交叉也有不同。同时,大数据应用也是机遇,必须对大数据应用的商业利益与公众的隐私保护需求做出适度的平衡。

二、个人信息与隐私的含义,区别与联系

个人信息是指与自然人个人或家庭密切相关数据或者资料,有些能够定位或者识别个人身份,有些虽然不能定位或者确定身份,但与个人特征、信仰、健康状况、行为习惯、联络方式等有关。隐私在我国是历史上是早已有之的概念,但1949年以后至今,新中国法律意义上的隐私最早是1956年《全国人大常委会关于不公开审理案件的决定》首次在立法中使用的“阴私”提法:“人民法院审理有关国家机密的案件,有关当事人阴私的案件和未满十八周岁少年人犯罪的案件,可以不公开进行。”此后,1979年刑事诉讼法,人民法院组织法,最高法院在批复中也使用的是“阴私”这个提法,并界定了阴私案件的范围。从1982年《民事诉讼法(试行)》开始,1991年实行的《未成年人保护法》39条规定“任何组织和个人不得侵犯未成年人隐私”,从此我国法律和司法解释开始使用“隐私”而不再用“阴私”的提法。隐私的含义主要是指当事人不愿意他人知晓或者他人不便知晓的个人信息,事宜或不愿意或者不便他人介入的领域。《现代汉语词典》第五版对阴私的解释是不可告人之事,多指不好的事情,1998年重印的修订本解释则为“不可告人的坏事”,隐私:“不愿意告人或者不愿公开的个人的事”。可见,即使从非法律的普通人理解来看,隐私范畴大于阴私,隐私概念更为中性,没有贬义,除了阴私还有个人信息的内容可以构成隐私。

个人信息与隐私有区别也有联系:个人信息的内涵和外延都较大,与隐私有一部分交集,也有不完全相同之处。通常个人的信息包括:姓名,性别,年龄,婚姻家庭情况,联络方式(特别是手机等通讯设备号码,或者其他用户身份识别标识,包括码号,电子邮箱,即时通讯账户ID,家庭住址,可用以判断用户地理位置的移动或者其他设备的地理位置信息,等),健康状况,病史,基因信息,生物识别信息(指纹,脚印,血型,等),行为信息,包括个人活动信息,因使用移动计算机终端设备产生的浏览,搜索,交易,支付等信息。个人信息的概念比较中性,原来不是法律术语,2003年《居民身份证法》开始对警察泄露个人信息行为予以法律约束,2009年刑法修正案七规定非法提供、获取个人信息定为犯罪,此后,此概念成为法律用语,换言之,刑法先于民法对个人信息进行了保护。但目前还没有法律对个人信息的含义与范围作出规定或者限定,根据目前技术发展迅速的特点,个人信息的概念可能还会随着技术和商业发展有所变化。

目前正在从个人计算机为主的互联网走向移动互联网时代,隐私主要有:与性有关的行为或者其他信息,不宜公开的照片及音视频资料,财产、个人金融信息,生理情况,个人卫生和排泄等行为,不便公开的健康和疾病信息,等,在网络时代比较突出的网络隐私主要有:个人计算机终端设备产生、访问的敏感信息,用户通讯内容,用户的各类账户密码信息,等。

目前开始崭露头角的可穿戴设备,以及具备检测人体各项指标的手环,手表等各种设备,其对人体各种数据的采集即使个人信息也属于隐私。因而,如何确定个人信息的使用将平衡个人隐私保护与新技术给人类带来的福音。

三、中外个人信息与隐私的案例比较与分析

我国已经发生的个人信息泄露与滥用的案件很多都与隐私受到侵犯密切相关,比较典型的案例有“海运女”案件,“微博开房门”事件,“郭美美”事件,王菲诉张乐奕“北飞的候鸟”侵犯隐私案,等。美国发生过的有较大影响的个人信息案例包括2012年FTC调查谷歌隐私案,因safari浏览器隐私问题而对谷歌处以2250万美元的罚款。

在海运女案件中,法院判决搜索引擎因未履行《互联网信息服务管理办法》规定的监管责任,“百度公司在知道或应当知道网络用户利用其服务传播侵权内容的情况下,未采取合理的必要措施,应当承担责任”。本案判赔金额仅仅为2.2万元。在另外一个影响甚广的王菲诉张乐奕“北飞的候鸟”案件中,法院经公开召开研讨会,后判决侵权成立,赔偿人民币5000元。如果说后案因为存在道德上的争议,法院判决赔偿较低可以理解的话,前者的赔偿金额较低,就是我国目前常见的“赢了官司输了钱”现象的反映了。相比较而言,2001年Double Click公司就设立了首席隐私官职位,2007年该公司并入谷歌,2012年谷歌还是发生safari浏览器隐私问题罚款2250万美元。可见网络个人信息和隐私保护必须从长计议,不是简单某个措施就可以解决的。

四、个人信息保护的法律途径:

刑法修正案七,非法获取个人信息罪,这是对于新兴网络现象刑法再一次走在民事立法之前,刑法率先对个人信息的贩卖等行为采取严厉刑事制裁措施。

2011年修订的《居民身份证法》第6条规定:“公安机关及其人民警察对因制作、发放、查验、扣押居民身份证而知悉的公民的个人信息,应当予以保密。”第13条规定:“有关单位及其工作人员对履行职责或者提供服务过程中获得的居民身份证记载的公民个人信息,应当予以保密。”第19条规定:“国家机关或者金融、电信、交通、教育、医疗等单位的工作人员泄露在履行职责或者提供服务过程中获得的居民身份证记载的公民个人信息,构成犯罪的,依法追究刑事责任;尚不构成犯罪的,由公安机关处十日以上十五日以下拘留,并处五千元罚款,有违法所得的,没收违法所得”。

2012年底通过的《全国人大常委会关于加强网络信息保护的决定》,明确提出保护能够识别个人身份和涉及隐私的电子信息。2014年3月15日实施的《消费者权益保护法(修正案)》规定,个人信息依法得到保护,确立了工商行政机关可以对侵犯个人信息进行行政处罚的职能,确认了公民可以向法院起诉。但这两部法律都没有解决如何赔偿问题。因而,在法律实施到现在,还没有发生有影响力的个人信息方面的民事案件。日常生活经验表明,个人信息广泛被贩卖和滥用的情况没有取得明显的好转。仍需要思考如何从制度上确立预防和制止个人信息泄露与滥用的有效机制。

国外关于个人信息的保护,主要立法经验有:美国有《隐私权法》《电子通讯隐私法》等多部法律,主要是隐私保护,在美国隐私观念深入人心,用户有较强的隐私保护意识。欧盟以《个人数据保护指令》确立的个人数据保护模式,德国于1976年颁布《联邦资料保护法》,法国于1978年通过《法国自由、档案、信息法》,1984年英国制订《数据保护法》。根据笔者与来华的这些国家国籍的朋友交流情况来看,这些国家个人信息滥用远不如中国严重,笔者分析认为主要原因还在于较强的隐私意识文化传统及其成熟的法治,一旦侵犯个人隐私会承担较为严重的法律后果。

笔者认为,根据目前已经能看到的个人信息在移动互联网时代的广泛采集和应用,原有隐私权不能满足对个人信息应用和保护的需要,有必要在民法上创设个人信息权概念,是一种人身权(人格权)兼具财产权性质,类似知识产权的一种复合型民事权利。具体权能为:知情权(对采集、应用、存储、管理和销毁个人信息有知情了解的权利),处分权(允许采集、应用、存储、销毁个人信息),受益权(对个人信息的商业性使用获得收益的权利),不作为请求权(对不符合个人意愿的个人信息采集使用行为有拒绝、请求停止、消除的权利,此权能可以包含美欧目前已经被广泛讨论的“被遗忘权”)。隐私权的生活安宁权虽能涵盖一部分前述的权能内容,但个人信息可以许可他人使用,并从从获取经济收益,这些行为与传统的隐私权人格权特征有较大出入,因而单独确立个人信息权可以成立。

五、个人信息民事立法的基本制度构建

虽然我国已经在个人信息保护上进行了若干立法,但仍然存在明显的缺陷,即没有惩罚性的民事制裁措施,无法从制度上预防个人信息滥采滥用,也无法斩断个人信息的灰色利益链条。由于行政处罚需要证据,刑事处罚需要一定门槛,法律规定的行政惩罚措施和刑事打击在日常生活中罕见使用,因而在经济利益驱动下,几乎每个人在生活中都仍然难免经常性遭遇个人信息泄露与滥用的危害。借鉴博弈论的经济学理论,笔者建议在个人信息保护立法中建立以下基本民事制度,以引导企业遵守保护个人信息的法律规范:

首先是设立个人信息使用者和收益者对个人信息来源进行合法性审查的合理谨慎义务。即要求使用个人信息进行商业宣传或者其他推广的机构和个人应当对信息来源合法性进行合理谨慎的注意,为避免企业通过子公司或者第三方规避此义务,因而有必要加上受益人也负有此责任,包括广告主和实际受益人,不限于广告经营者或者直接者。只有建立了此制度,才能杜绝正规企业采购营销服务不审查个人信息的合法性,从而在客观上助长个人信息泄露与滥用的现象。同时,如果能够较好执行本制度,等于打击和消灭了非法采集和滥用个人信息的销售、变现渠道,使其失去违法的经济驱动力。

其次是建立递进式惩罚性赔偿制度。我国立法已经确立了企业对个人信息和隐私的保护义务,可以在此基础上扩展为企业对个人信息的安全保障义务。对于违反企业信息安全保障义务的,确立递进式惩罚性赔偿制度。我国侵权责任法已经有惩罚性赔偿制度的规定,但由于法院在确定赔偿时过于审慎,迄今为止没有看到有影响力的适用侵权责任法关于惩罚性赔偿的民事判决案件。消费者权益保护法自立法之初即确立了对欺诈的惩罚性赔偿制度,二十年来,通过典型案例的媒体报道,在社会上有广泛的影响,是我国民事法律中发挥了较好引导作用的法律规范。而且,我国的惩罚性赔偿限于欺诈或者主观恶意,消法修改后,欺诈的惩罚性赔偿额限于实际损失三倍以下,也规避了美国司法制度中赔偿过于庞大的负面作用。

因而,在个人信息侵权行为的民事赔偿方面,有必要继承前述法律已经有的成果。鉴于个人信息侵权行为往往难以证明损害后果,如果法律不规定法定赔偿标准或者计算方法,由于我国法院坚持填平式赔偿原则,实际诉讼中赔偿将延续目前较低局面而不会具有威慑力,仍然无法改变在利益驱使下泄露滥用个人信息的局面。因而,比较现实可行的是建立递进式的惩罚性赔偿制度,即对于三次以上侵犯个人信息权,或者经行政处罚或者诉讼判决侵权成立,仍然拒不改正的,法律应设定较大的法定赔偿责任,或者在按照普通民事侵权三倍以下予以赔偿,或者经由消费者保护组织起诉的,可以设定较大额赔偿,由消费者组织在受害者中予以分配。只有违法行为人了解一旦实施违法行为其法律责任将超过其获得的收益时,才可能根本上扭转个人信息过度收集,随意泄露和普遍滥用的混乱局面。

第三是建立个人信息规范、合理使用的制度。在大数据应用前景极为广阔的今天,应该为企业大数据应用留下空间,引导企业规范使用,而不能因噎废食,因限制过严导致企业无法开展大数据应用,公众也无法享受网络技术发展带来的便捷与进步。因而,建议确立在满足下面三个条件的前提下,允许企业采集、应用、存储、管理并销毁个人信息:

1、经公示或者告知信息收集目的,收集、应用、存储和销毁规则,并且采取合理措施履行保护个人信息避免泄露和滥用;

2、不披露具体个人的信息,也不能根据数据应用的结果反向联系或者确定到具体个人;

3、不违反隐私保护的强制性规定。

个人信息的合理使用,是指为履行与用户所订立合同目的,或者为保护用户之合法权益,按照最低必要限度原则收集个人信息,并诚实信用使用个人信用使用个人信息,包括身份验证,通知联络,履行合同订立的先合同义务以及履行合同后的附随义务等。合理使用应当是非商业目的,并且不得违反法律的强制性规定。

第四、建立个人信息举证责任倒置。网络时代信息由企业收集,存储于企业的服务器,用户往往难以举证,因而,在个人信息收集、存储、管理、应用和销毁相关事实发生争议时,应由服务器所有人的企业进行举证,否则维权人将因为举证不能而无法获得保护。有必要说明的是,鉴于可能泄露信息的环节可能很多,为避免企业承担过重的举证责任以及被滥用,因而举证责任倒置应该是指企业提供存储的个人信息,以及举证证明自己按照法律和相关行业标准履行了个人信息保护的软件和硬件、管理等相关标准和要求,即履行了信息安全保障的法定合理谨慎义务。

数据信息论文第9篇

首先,中心服务器、必备的客户端,建构了B/S这一框架。网络环境之中,用户随时辨识车站范畴的设备态势。在最大范畴内,互通并分享搜集得来的信息。其次,数据搜集依托的终端、配套架构下的服务器,也采纳同一结构。若终端发觉了体系之中的配件故障,或拟定好的指标没能吻合,则即刻把辨识出来的这类误差,传递至服务器。对于接纳的消息,服务器要辨识及判别它们。把反馈得来的精准信息,采纳短信方式,通知运维人员。这样做,就提快了信息互通的速率。再次,设备故障特有的预警,建构了最优模型。通过数值解析,在线查验潜藏着的若干隐患,协助关联人员。若某一时段的某类指标,超出了拟定的常规水准,则快速辨识它。此外,系统搜集得来的大量数据,都可予以统计。经过统计流程,寻找深层级的潜在规律。深入挖掘信息,便利了信息解析。

二、结合情形下的监测运用

布设双服务器,采纳Web建构的体系,来访问数据库。在这种状态下,即便体系繁忙,彼此设定好的独立业务,也不会扰。为保护网络架构之中的数据安全,在数据库固有的前侧,布设了硬件特有的防火墙。为提升原有的可靠水准,添加了UPS特性的供电电池。这样一来,即便失掉了外部供应过来的电能,还可维持住5小时的常态运转。

(一)实时信息解析信号设备经由搜集

能获取运行时段之中的各类信息。这种实时数据,整合了某时点的体系电压、频次及电流、继电器表征的状态。把搜集得来的关联数值,妥善予以存储。实时解析的侧重点,包含站场以内的真实状态。依托这种状态,辨识多层级的设备情形。行车关涉的影响状态,依托声光报警,把它提示给区段内的用户。建构故障辨识依托的新颖模型,查验根本成因,拟定可用的意见。中心服务器特有的性能,是把解析得来的故障类别,发送至某机械,以便及时响应。

(二)判别体系状态信号设备特有的状态查验

包含如下的特性:解析数据时,若发觉体系以内的某一设备凸显了偏移指标,脱离了许可范畴,则采纳声光报警,提供预警显示。拟定关联模型,辨识预警的根本成因,提供指引建议。

(三)设定访问流程用户依托网络

访问建构好的平台网站。车站搭配着的人机界面,可被妥善下载。经过界面回放,搜集任一时点的关联数据。把累积得来的这类数据,经过搜集归整,存放至数据库。解析这类存留的信息,即可辨识以往某一区段的故障类别、监测处理的路径。解析运行曲线,可以排查故障,协助场地之中的技术人员,查验故障根源。体系建构了多重的统计方式,例如报表及曲线,以此便利数值搜集。四、远程运维管控GPRS特有的远程运维,建构了新颖平台。这样的新平台,能实时记下体系以内的分界点。设备表征的报警倾向、继电器凸显的现有状态、数据互通依托的通道,都可以被管控。某一配件故障之时,把关涉的事故信息,上传至固有的中心设备。依托服务器,把带有故障特性的这类信息,发送给关联的手机。拟定统计报表,记下车站某一时段的行车状态。

三、结语