GY T 339.2-2020 有线电视网络大数据技术规范 第2部分:平台要求.pdf
《GY T 339.2-2020 有线电视网络大数据技术规范 第2部分:平台要求.pdf》由会员分享,可在线阅读,更多相关《GY T 339.2-2020 有线电视网络大数据技术规范 第2部分:平台要求.pdf(26页珍藏版)》请在麦多课文档分享上搜索。
1、 GY 中华人民共和国 广播电视和网络视听 行业标准 GY/T 339.2 2020 有线电视网络大数据技术规范 第 2 部分:平台要求 Technical specification for CATVs big data Part 2: Platforms requirements 2020 - 12 - 22 发布 2020 - 12 - 22 实施 国家广播电视总局 发布 GY/T 339.2 2020 I 目 次 前言 . II 引言 . III 1 范围 . 1 2 规范性引用文件 . 1 3 术语和定义 . 1 4 缩略语 . 2 5 概述 . 3 6 数据核心子系统技术要求 .
2、4 6.1 数据采集接入 . 4 6.2 数据存储 . 5 6.3 数据处理 . 7 6.4 数据分析 . 9 6.5 数据展示 . 13 6.6 数据开放 . 14 6.7 资源管理 . 14 7 基础资源子系统技术要求 . 15 8 安全运行子系统技术要求 . 15 9 运行维护子系统技术要求 . 15 9.1 概述 . 15 9.2 运维能力和支撑保障 . 16 9.3 运维操作 . 16 9.4 运维过程管理 . 16 附录 A(资料性) 大数据参考体系架构 . 18 参考文献 . 20 GY/T 339.2 2020 II 前 言 本文件按照 GB/T 1.1 2020标准化工作导则
3、 第 1部分:标准化文件的结构和起草规则的规定 起 草。 本文件为 GY/T 339 有线电视网络大数据技术规范 的第 2部分。 GY/T 339已经发布了以下部分: 第 1 部分:通用要求; 第 2 部分:平台要求; 第 3 部分:数据规则。 请注意本文件的某些内容可能涉及专利。本文件发布机构不承担识别这些专利的责任。 本文件由全国广播电影电视标准化技术委员会( SAC/TC 239)归口。 本文件起草单位:国家广播电视总局广播电视规划院、中国电子技术标准化研究院、广州市诚毅科 技软件开发有限公司、浩鲸云计算科技股份有限公司、北京东方国信科技股份有限公司、华数数字电视 传媒集团有 限公司、国
4、家广播电视总局广播电视科学研究院、重庆有线电视网络股份有限公司、中国广 播电视网络有限公司、北京歌华有线电视网络股份有限公司、广东省广播电视网络股份有限公司、湖北 省广播电视信息网络股份有限公司、河北广电无线传媒有限公司、深圳市天威视讯股份有限公司、陕西 广电网络传媒(集团)股份有限公司、陕西广信新媒体有限责任公司、贵州省广播电视信息网络股份有 限公司、江苏省广电有线信息网络股份有限公司、北京邮电大学、北京海致星图科技有限公司、广西广 电大数据科技有限公司、新疆广电网络股份有限公司。 本文件主要起草人:余英 、韦安明、吴钟乐、张群、刘智、王帅、刘敬玉、唐志燕、李庆国、聂明 杰、邓向冬、曹志、王
5、倩男、赵明、赵士原、欧阳峰、杨旭、沈文、唐永壮、董彬、刘军霞、胡其权、 刘彦鹏、柳涛、杨晨、王洪波、王飞、梅杨、唐昊、陈昕、尹卓、曹燕明、诸葛海标、胡暐宸、张玮、 刘晓敏、王欣然、曹阳、李海波、鞠宏、付晶、赵良福、苟明宇、杨敬一、王季友、刘艺兰、张城瑞、 周传淯、傅力军、王瑶、范斐、孙嘉阳、张琦、陶宛昌、张君、王士刚、杨娟、郑璐、林昕、李文、涂 均、吕燕、刘波、彭宇涛、杨斌。 GY/T 339.2 2020 III 引 言 GY/T 339有线电视网络大数据技术规范规定了有线电视网络大数据技术规范的通用要求,包括 大数据系统和数据服务的功能、性能、接口、安全等方面的要求,适用于有线电视网络大数
6、据系统和业 务的规划、设计、实施、验收、升级改造和运行维护 。 GY/T 339共有三个部分。各部分简述如下。 第 1 部分:通用要求。规定了有线电视网络大数据系统和数据服务的功能、性能、接口、安全 等方面的要求。 第 2 部分:平台要求。规定了有线电视网络大数据平台的结构和技术要求。 第 3 部分:数据规则。 规定了 有线电视网络大数据的数据源、数据内容和数据表达规则。 GY/T 339.2 2020 1 有线电视网络大数据技术规范 第 2 部分:平台要求 1 范围 本文件 规定了 有线电视网络大数据平台的结构和技术要求,还规定了对有线电视网络大数据采集、 接入、存储、处理、分析、展示和开放
7、服务的技术要求 。 本文件适用于有线电视网络数据的采集、接入、存储、处理、分析、展示和开放服务,还适用于指 导有线电视网络运营机构开展大数据平台的规划设计、实施、升级改造和运行维护。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 GB/T 22239 2019 信息安全技术 网络安全等级保护基本要求 GB/T 35295 2017 信息技术 大数据 术语 GB/T 35589 2017 信息技术 大数据 技术参考模型 GB 5017
8、4 2017 数据中心设计规范 GY/T 337 2020 广播电视网络安全等级保 护定级指南 GD/J 075 2018 电视收视数据交换接口规范 3 术语和定义 GB/T 35295 2017界定的以及下列术语和定义适用于本文件。 3.1 大数据 big data 具有体量巨大、来源多样、生成极快、多变等特征并且难以用传统数据体系结构有效处理的包含大 量数据集的数据。 来源: GB/T 35295 2017,定义 2.1.1 3.2 大数据参考体系结构 big data reference architecture 一种用作工具以便于对大数据内在的要求、设计结构和运行进行开放性探讨的高层概
9、念模型。 来源: GB/T 35295 2017,定义 2.1.3 3.3 数据中心 data center GY/T 339.2 2020 2 由计算机场站(机房)、机房基础设施、信息系统硬件(物理和虚拟资源)、信息系统软件和信息 资源(数据)等组成的实体。 3.4 大数据平台 big data platform 以大数据参考体系结构为基础的数据中心系统,在本文件中,指集成了大数据采集接入、存储、处 理、分析、共享,以及各类配套功能组件及基础设施的数据处理系统。 3.5 数据采集终端 data collection terminal 一种部署在数据生成节点的、实现数据规范收集汇总和处理的软件
10、组件或实体设备。 3.6 大数据系统 big data system 以大数据参考体系结构为基础的数据处理系统,在本文件中,指由大数据平台、数据源、数据采集 终端、网关,以及相关辅助等功能组件构成的数据处理系统。 来源: GB/T 35295 2017,定义 2.1.14。 3.7 元数据 meta data 一种带有数据类型、编码、名称、业务描述等属性的,可用于描述数据产品特征的数据单元。 3.8 框架 framework 一种由数据的采集、接入、存储、处理、分 析、服务等功能组件构成的集合。 4 缩略语 下列缩略语适用于本文件。 API 应用程序编程接口( Application Prog
11、ramming Interface) BSS 业务支撑系统( Business Support System) CEP 复杂事件处理( Complex Event Processing) CPU 中央处理器( Central Processing Unit) GPU 图形处理器( Graphic Processing Unit) HDD 硬盘驱动器( Hard Disk Drive) IO 输入输出( Input and Output) MPI 消息传递接口 ( Message-Passing-Interface) MSS 管理支撑系统( Management Support System)
12、NoSQL 非关系型的数据库 ( Not only SQL) OLAP 在线分析处理( On-Line Analysis Processing) OSS 运营支撑系统( Operation Support System) RAID 独立磁盘冗余阵列( Redundant Arrays of Independent Drives) SQL 结构化查询语言 ( Structured Query Language) GY/T 339.2 2020 3 SSD 固态盘( Solid State Disk) XML 可扩展 标记语言 ( Extensible Markup Language) 5 概述
13、大数据平台实现对运营机构经营和系统运行维护过程中产生的各类大数据的采集、接入、处理、存 储、分析、展示、共享和管理,为大数据消费者提供数据和服务,以及为运营机构间的数据交换提供统 一接口。图 1采用 GB/T 35589 2017中关于大数据参考体系架构的定义,采用角色、活动、组件等逻辑 构件描述有线电视网络大数据平台(以下简称大数据平台或平台)的组成和业务逻辑。关于大数据参考 体系架构,以及角色、活动、组件的描述见附录 A。 采 集 接 入 框 架 计 算 框 架 大 数 据 平 台 组 件 组 件 活 动 活 动 图 例 : 角 色 角 色 物 理 安 全 物 理 安 全 通 信 安 全
14、通 信 安 全 边 界 安 全 边 界 安 全 计 算 安 全 计 算 安 全 安 全 运 行 业 务 安 全 业 务 安 全 基 础 配 套 机 房 设 施 机 房 设 施 计 算 资 源 计 算 资 源 存 储 资 源 存 储 资 源 网 络 资 源 网 络 资 源 批 量 采 集 批 量 采 集 实 时 采 集 实 时 采 集 输 入 A P I 输 入 A P I 输 出 A P I 输 出 A P I 采 集 与 I O 采 集 监 控 采 集 监 控 采 集 展 示 采 集 展 示 监 控 展 示 采 集 配 置 采 集 配 置 数 据 源 配 置 数 据 源 配 置 配 置 管
15、理 流 处 理 流 处 理 数 据 处 理 内 存 计 算 内 存 计 算 批 处 理 批 处 理 图 计 算 图 计 算 批 流 混 合 计 算 批 流 混 合 计 算 离 线 分 析 离 线 分 析 数 据 分 析 交 互 式 分 析 交 互 式 分 析 流 式 分 析 流 式 分 析 支 撑 组 件 支 撑 组 件 系 统 资 源 管 理 资 源 管 理 框 架 等 保 定 级 等 保 定 级 定 级 测 评 定 级 测 评 等 保 管 理 能 力 建 设 能 力 建 设 例 行 操 作 例 行 操 作 运 维 管 理 运 维 管 理 运 维 管 理 服 务 开 放 数 据 展 示 数
16、据 展 示 服 务 能 力 展 现 / 申 请 / 运 营 服 务 能 力 展 现 / 申 请 / 运 营 大 数 据 应 用 精 准 营 销 精 准 营 销 精 细 服 务 精 细 服 务 精 确 管 理 精 确 管 理 精 益 网 运 精 益 网 运 收 视 评 价 收 视 评 价 门 户 服 务 门 户 服 务 企 业 合 作 数 据 共 享 企 业 合 作 数 据 共 享 . . . 有 线 电 视 网 络 大 数 据 源 M S S 域 数 据 M S S 域 数 据 B S S 域 数 据 B S S 域 数 据 其 他 其 他 O S S 域 数 据 O S S 域 数 据 .
17、. . 数 据 上 报 平 台 侧 数 据 平 台 侧 数 据 元 数 据 格 式 转 换 元 数 据 格 式 转 换 数 据 服 务 框 架 抽 取 抽 取 预 处 理 转 换 转 换 清 洗 清 洗 加 载 加 载 文 件 系 统 文 件 系 统 数 据 存 储 列 式 数 据 库 列 式 数 据 库 关 系 数 据 库 关 系 数 据 库 图 数 据 库 图 数 据 库 数 据 开 放 数 据 开 放 资 源 管 理 子 系 统 子 系 统 运 行 维 护 子 系 统 安 全 运 行 子 系 统 基 础 资 源 子 系 统 数 据 核 心 子 系 统 系 统 安 全 系 统 安 全 元
18、数 据 管 理 数 据 资 源 管 理 网 关 数 据 流 图 1 大数据平台示意图 大数据平台由数据核心子系统、基础资源子系统、安全运行子系统和运行维护子系统组成。 数据核 心子系统是大数据平台的核心组成部分,由数据采集接入、数据存储、数据处理、数据分析,数据服务、 资源管理等框架组成, 负责实现数据输入、计 算处理和输出功能,以及对外开放大数据平台的数据服务 功能。基础资源子系统为大数据平台提供机房、计算资源、存储资源、网络资源等基础服务,安全运行 子系统和运行维护子系统为数据处理提供基本保障。 大数据平台应支持采集、接入、处理运营机构的 BSS、 OSS、 MSS数据,广告、媒资、用户收
19、视行为、 用户体验数据,以及网管、门户网站等数据,具体支持的数据内容如图 2所示。上传到大数据平台的数 据,其格式和交互方式应与 GY/T XXX.1 XXXX的要求相符,例如大数据平台应具备采集接入符合 GD/J 075 2018要求的数据。 GY/T 339.2 2020 4 有线电视网络数据源 B S S 域数据 O S S 域数据 M S S 域数据 其他数据 客户关系管理数据 综合计费账务数据 合作伙伴管理数据 统一用户认证数据 呼叫中心 / 客服数据 服务开通管理数据 综合运维管理数据 网络监控管理数据 综合资源管理数据 人力资源管理数据 采购与仓储管理数据 项目管理数据 财产管理
20、数据 协同办公数据 用户收视行为数据 媒资数据 广告数据 用户体验数据 用户宽带行为数据 用户自助渠道数据 . . . . . . . . . . . 图 2 数据内容 6 数据核心子系统技术要求 6.1 数据采集接入 6.1.1 基本要求 要求如下: a) 应支持结构化数据、半结构化数据、非 结构化 数据 的 批量导入 ; b) 宜支持从文件服务器的多个目录并发导入数据; c) 应 支持 离线 数据 导入功能 , 延时 应 不超过 24h; d) 应支持实时采集 ; e) 应支持定时采集,如可根据预设的频率(小时、天等),自动对选定的数据源进行增量或者全 量采集或导入; f) 应支持对采集对
21、象进行远程配置,如远程设置采集对象的采集频度、采集时间、采集数据量等; g) 应支持采集对象的注册、发布、使用授权、变更、注销等管理; h) 应支持手动控制采集任务的执行过程; i) 宜支持图形化的数据导入配置界面。 6.1.2 输入输出 API 要求如下: a) 应为数据采集终端或网关提供数据输入 API; b) 应为计算框架提供数据输出 API。 6.1.3 采集接入监控 要求如下: a) 应支持监控采集对象的运行状态; b) 应支持监控釆集网络的运行状态,如采集对象所在网络的通断; c) 应支持监控采集任务的执行情况,如支持了解采集任务执行时间、任务进度、已采集数据量等; d) 应支持监
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GY 339.2-2020 有线电视网络大数据技术规范 第2部分:平台要求 339.2 2020 有线电视网络 数据 技术规范 部分 平台 要求
