大数据视域下的高校数据治理

时间:2020-10-14作者:动态浏览次数:839

“互联网+”时代的到来,互联网、社交网络、物联网、移动互联网、云计算等相继进入人 们的日常工作和生活中,并潜移默化地改变着用户的意识形态。高校信息化被迫要求扮演多元 化的角色,对高校的信息化建设提出了更高的要求。《教育信息化“十三五”规划》明确提出 要建设“智慧校园”,高校由“数字校园”逐步迈向“智慧校园”,不断探索“以数据为核心 资产、以数据驱动业务革新”的发展模式已成为我国高校向“双一流”迈进的必然趋势。数据 的体量越大、维度越多,就越能够更好地为用户精准分析和个性化服务提供威廉希尔官网潜在的信息。 


在数据挖掘驱动教育、变革教学的“互联网+”时代,教育领域同样蕴藏着具有广泛应用价 值的海量数据。探索教育变量之间的相关关系,进行大数据的教育应用,为教育教学提供有效 的决策支持服务,促进教育教学的变革与创新,成为十三五期间构建“智慧校园”的新型课题。


高校信息化正面临怎样的问题?


在“十二五”至“十三五”期间,我国高校已基本迈入信息化时代。高校在不断整合业务 流程、打破数据孤岛、统筹线上管理、享受信息化建设和快速发展带来丰硕成果的同时,也逐 渐面临着数据标准不统一、数据源头不清晰、数据流转不顺畅、数据应用不能满足需求等一系 列问题,给教学、科研、管理及服务造成了诸多不便。支撑数据获取不便,或无从获取,或从 不同渠道获取数据不一致。在未来“智慧校园”的建设中,高校迫切需要更为便捷的信息化手 段支撑教学、科研、管理及服务工作,建立完善的数据服务平台,实现对数据的安全、规范的 采集、存储、交换及应用,是实现个性化管理服务的基础。 


在上述内在和外在的需求背景下,高校制定统一的数据标准、实现业务系统数据、机器数 据及公共数据的高度融合、构建稳定且半开放的数据平台必需且必要。开展数据治理工作,解 决当前数据共享中存在的“数据质量不高、数据流向混乱、共享度不足、历史数据缺失”问题, 实现对高校数据中心的重构,构建数据治理平台,对高校业务系统数据有序且规范化地进行梳理、采集、清洗、标准化规范存储和应用,实现威廉希尔官网数据资产的有效管理和数据的深度共享。 抽取并整合全校所有业务系统的结构化数据,以及各系统运行日志和互联网数据等非结构化数 据,按主题分类进行数据梳理,用于威廉希尔官网在管理、科研、教学及服务改革等业务层面宏观的统 计、挖掘、预测。同时,深度治理后的数据能够在教学、科研、管理等多方面全面服务于高校 发展,其意义主要体现在:深入促进服务创新和价值创造、有效提升管理和决策水平、提升校 园数据质量和数据可信度、提高合规监管和安全风险控制,使高校师生能够充分享受大数据带 来的个性化及贴心化服务。


高校教育大数据治理的目标


数据标准规范化

数据标准是在高校数据平台框架下,保障高校内、外部使用和交换数据的一致性和准确性, 具有行业特点且共同使用的一种规范性约束。数据标准是高校数据平台数据治理的基础,亦是 数据治理建设中的首要环节。一方面,数据标准为高校数据平台提供统一的数据标准定义和平 台逻辑模型;另一方面,数据标准是高校数据平台进行数据治理的依据和根本。数据标准是衡 量高校数据平台数据资产运营和管理的评估依据。数据标准规范化的管理内容包 括:构建基于校情的数据管控制度及数据标准管理组织、制定基于数据流程的规范性文件、实 现信息项数据字典标准的规范化定义。


数据管理脉络化

通过对数据流的梳理,可以看出数据管理的任务是构建元数据进行集中式的管理。在高校 数据范围内,元数据主要描述了各业务系统的数据范围、数据类别、数据定义、数据表之间的 关系以及数据流等信息。数据管理是元数据的创建、存储、整合以及控制的一整套流程的集合, 用以辅助在高校场景内开展各类元数据应用。 


通过对元数据的管理,大数据治理达到如下目标:

①提供校级数据字典,便于内、外部准 确掌握高校的数据概况;

②提供全局元数据查询检索,便于快速定位元数据;

③提供元数据详 细描述,便于快速了解数据组成、数据结构及数据流向;

④提供血缘/影响分析功能,便于进行 分析判断、问题定位;

⑤提供元数据接口服务,便于其它系统或模块使用元数据,实现数据交 互与共享服务;

⑥提供元数据应用,方便终端使用元数据。


高校元数据的特点在于逻辑相对趋 于集中,即将元数据管理作为统一的发布源,采用集中式的元数据管理模式,提供元数据的集 中创建、维护、查询功能,不断趋于脉络化。


数据质量度量化

数据质量深度反映了数据的“适用性”,即数据满足使用需要的合适程度。数据质量通过 完整性、一致性、准确性、及时性、合法性等多类维度进行度量。数据质量的度量化工作旨在 定义数据质量标准、建立数据质量审核机制、跟踪数据质量的全生态过程,为数据平台提供洁 净、结构清晰的高质量数据,是数据平台开发数据产品、提供数据服务、发挥大数据价值的必 要前提,是高校数据资产管理的关键因素。 


数据质量度量化的目标是:为高校内、外部用户提供平台化的数据质量监控,通过扩充和 优化公共规则库、增强后台对不同类型数据仓库和非结构化数据的兼容性,提升用户使用感受,并提供数据质量应用满足个性化需求。


数据内容精简化

业务数据、系统数据、机器数据、日志数据等形成了高校的结构化数据和非结构化数据集 合。数据源的多样性,严重制约了数据交换与共享。数据内容的精简化工作旨在消除重复数据、 修正错误数据、实现数据的多次清洗、完成基于数据标准的转化等,以降低数据维护成本。




本文节选自:CNKI,作者:余鹏、李艳。