1、 ICS 35.240 CCS L 73 41 河南省地方标准 DB41/T 23082022 互联网网站视听节目监管平台 基本功能要求 2022-09-16 发布2022-12-14 实施河南省市场监督管理局发 布 DB41/T 23082022 I 目次 前言.II 引言.III 1 范围.1 2 规范性引用文件.1 3 术语和定义.1 4 缩略语.2 5 基本要求.2 6 平台架构.2 7 平台基本功能.2 8 外部接口.6 DB41/T 23082022 II 前言 本文件按照GB/T 1.12020标准化工作导则 第1部分:标准化文件的结构和起草规则的规定起草。请注意本文件的某些内容
2、可能涉及专利。本文件的发布机构不承担识别这些专利的责任。本文件由河南省广播电视局提出并归口。本文件起草单位:河南省广播电视局监听监看中心。本文件主要起草人:苏铭、黄剑祎、裴鹏真、黄鑫、冯俊昌、南云珀、冯国建、周玉洁。DB41/T 23082022 III 引言 随着互联网网站、微信、微博、IPTV、OTT、移动客户端等网络视听节目传播平台的大规模出现,广播电视行政管理部门的监测监管内容已经由单一的传统广播电视内容监测监管走向多元化网络视听节目监测监管。十余年来,国家广播电视行政管理部门,省、市、县各级广播电视行政管理部门及其他网络视听节目监管部门,都在不断探索网络视听节目监管平台功能应用。针对
3、现有互联网网站视听节目监管平台功能达不到行业监管需求的情况,依据国家广播电视行政管理部门相关政策要求,结合河南省互联网网站视听节目多年监测监管经验,制定本文件。DB41/T 23082022 1 互联网网站视听节目监管平台 基本功能要求 1 范围 本文件规定了互联网网站视听节目监管平台的基本要求、平台架构、基本功能和外部接口。本文件适用于互联网网站视听节目监管平台(以下简称“监管平台”)的管理与运行。2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于
4、本文件。GB/T 222392019 信息安全技术 网络安全等级保护基本要求 3 术语和定义 下列术语和定义适用于本文件。3.1 互联网网站视听节目监管平台 对互联网网站上传播的视听节目内容进行监管的信息系统。3.2 特征信息 文字、图片、音频、视频中数字化内容的特殊信息。3.3 节目信息 描述视听节目基本情况、反映视听节目传播情况的基本信息,包括节目名称、播放数、评论数、转发数等内容。3.4 定向信息搜索 对指定的信息内容,在指定的、有限的互联网网站范围内进行搜索。3.5 角色 监管平台赋予使用者具有相应权利和责任的一种用户身份。3.6 归一化 对节目及节目信息进行统一清洗、转化,使得所有同
5、类信息格式保持一致的数据处理。DB41/T 23082022 2 3.7 本地 监管平台正常运行所依赖的物理环境,独立于外部网络环境。4 缩略语 下列缩略语适用于本文件。ICP:网络内容服务商(Internet Content Provider)IP:网际互连协议(Internet Protocol)IPTV:交互式网络电视(Internet Protocol Television)JSON:JAVA脚本对象简谱(JavaScript Object Notation)OTT:互联网电视(Over The Top)SOA:面向服务的架构(Service-Oriented Architecture
6、)URL:统一资源定位符(Uniform Resource Locator)XML:可扩展标记语言(EXtensible Marku Language)5 基本要求 监管平台应提供可视化人机交互方式,做到简单、适用、易维护。5.1 监管平台应具有完善的自动备份和恢复功能,有容错、检错、纠错和恢复能力,能防范发生系统5.2 性宕机、崩溃等意外风险。监管平台采用的模块、中间件、SOA 等技术应符合相关标准,提供相应的接口协议和数据格式,5.3 支持监管平台功能扩充。监管平台管理运行应符合国家相关法律、法规和相关标准的要求,网络安全等级不应低于 5.4 GB/T 22239 中第二级安全要求。6 平
7、台架构 互联网网站视听节目监管平台架构图见图1。7 平台基本功能 信息库功能 7.1 7.1.1 互联网网站备案信息库功能 存放属地备案的互联网网站信息,为监管平台提供官方、权威、准确、可靠的监管对象信息。每个网站信息条目应包括:网站名称,网站首页地址,网站IP,网站创办人姓名、身份证号,网站ICP备案号,信息网络传播视听节目许可证号,网站备案地址,网站备案人,网站备案联系人等多个必要关键信息字段。应具备对网站进行分类展示的功能,包括:持证/备案网站、重点视听网站、非重点视听网站、疑似违规视听网站、违规查处网站、历史视听网站等数据列表。DB41/T 23082022 3 图1 互联网网站视听节
8、目监管平台架构图 7.1.2 违规特征信息库功能 存放文本、图片、音频、视频的违规样本特征信息,是判定违规的依据。每个违规特征信息条目应包括:违规特征信息的名称、属性、违规类型、发行者、发现时间、导入时间、信息描述、获取来源、物理存储路径等多个必要关键信息字段。7.1.3 互联网网站节目信息库功能 存放互联网网站上传播视听节目的详细信息。每个详细信息条目应包括:节目名称、描述、链接、发行时间、点击数、评论数、点赞数、转发数、节目内容物理存储路径、疑似违规类型,所属网站网址、名称、类型等多个必要关键信息字段。应具备展示疑似违规节目和违规节目等数据列表的功能。7.1.4 信息网络传播视听节目许可证
9、信息库功能 存放信息网络传播视听节目许可证的详细信息。每个许可证详细信息条目应包括:许可证号、开办单位、开办地址、法人代表、开办单位联系人、开办单位联系方式、发证日期、发证单位、有效期、网站URL、网站名称、许可证图片物理存储路径等多个必要关键信息字段。7.1.5 行政处罚信息库功能 存放因涉嫌传播违规内容而受到行政处罚的网站信息记录。DB41/T 23082022 4 每个行政处罚信息条目应包括:处罚类别、处罚描述、处罚时间、处罚网站名称、处罚网站URL、处罚网站联系人等多个必要关键信息字段。7.1.6 任务评价信息库功能 存放上级和同级广播电视行政管理部门关于所有网站在指定时间段内开展视听
10、内容宣传表现情况的评价。每个任务评价条目应包括:任务名称、任务描述、任务类别、任务创建时间、任务结束时间、任务完成级别等多个必要关键信息字段。数据采集功能 7.2 支持将指定互联网网站上的视听节目及其信息采集到本地互联网网站节目信息库。可采用对本地互联网网站备案信息库中网站的节目信息进行一次性完备采集和后期多次增量采集方式,实现数据更新。数据分析与处理功能 7.3 7.3.1 归一化处理功能 支持对采集的节目内容及其信息按照以下方面进行数据清洗、格式转换、归一化处理:a)依据分辨率、图像大小及存储格式等参数对图片进行归一化处理;b)依据编码格式、音频采样率等参数对音频进行归一化处理;c)依据分
11、辨率、视频编码格式、音频编码格式等参数对视听数据进行归一化处理。7.3.2 排重功能 支持对采集到的互联网网站节目按照节目及其信息内容,与互联网网站节目信息库中的节目及其信息内容进行逐个比对,排除重复节目及其信息内容。7.3.3 智能比对功能 支持依据违规特征信息库中的违规特征信息,对互联网网站节目信息库中的节目及信息内容按以下方面进行智能比对:a)智能识别文本的语境、语义;b)智能识别图片特征信息;c)智能识别音频特征信息;d)智能识别视频特征信息。数据挖掘功能 7.4 支持对数据库中的节目信息进行多维度整合,利用归类、统计、分析等技术分析当前节目传播情况以及预测未来一段时间可能的传播趋势。
12、支持对视听节目文本信息通过自然语言处理等前沿技术实现智能标签分类、多模态检索功能。数据应用功能 7.5 7.5.1 疑似违规智能预警功能 DB41/T 23082022 5 支持按照智能比对结果以及预警阈值(疑似违规百分比),对疑似违规节目进行违规智能预警。包括:电子邮件通知、短信通知、平台预警(页面提醒、震屏、弹出窗口)等方式。7.5.2 人工核定功能 支持人工随机抽检审核,支持对智能预警疑似违规的网站和节目进行再次人工核定,支持将节目及其传播的网站核定为违规或正常。7.5.3 违规节目取证功能 支持对人工核定的违规节目进行自动取证,取证范围包括违规节目的详细内容及传播该违规节目网站URL等
13、信息。包括以下取证方式:自动截屏和自动录屏。7.5.4 定向范围节目搜索功能 7.5.4.1 实时定向范围搜索 支持对指定的文本信息在限定网站范围内进行实时在线搜索,确定其在限定网站范围内的传播情况。7.5.4.2 本地定向范围搜索 支持对指定的文本信息在本地互联网网站节目信息库进行离线搜索,确定其在限定网站范围内的传播情况。7.5.5 统计分析功能 7.5.5.1 热点节目统计分析 支持对设定时间段内传播频次较高的节目进行统计分析,包括传播时间、范围,以及点击次数、点赞次数、评论次数等信息。7.5.5.2 违规节目统计分析 支持对设定时段内传播的违规节目进行统计分析,包括传播时间、范围,以及
14、点击次数、点赞次数、评论次数等信息。7.5.5.3 分类统计分析 支持按节目的类型统计分析近期传播趋势。7.5.5.4 站外传播热度分析 支持对该节目源发网站以外的网站按照节目的点击次数、点赞次数、评论次数等信息进行传播热度情况统计分析。7.5.6 业务报表功能 对平台采集的数据及人工操作的业务数据进行统计:包括设定时间段内新增网站数、新增节目数、新增违规节目数、网站总数、节目总数、违规节目总数等信息。支持年、半年、季、月、周等周期报表;支持灵活的时间跨度设置。数据管理功能 7.6 DB41/T 23082022 6 7.6.1 信息库管理功能 支持对本地信息库中所有数据库的数据条目进行添加、
15、修改、删除、检索、统计等操作;支持对网站根据备案属地类型、网站服务类型、IP接入地址、疑似违法违规类型等多种类型进行分类;支持按照一定的文本格式(txt或Excel等规定格式)向互联网网站备案信息库、违规特征信息库、互联网网站节目信息库、信息网络传播视听节目许可证信息库、行政处罚信息库、任务评价信息库自动化批量导入/导出数据。7.6.2 数据的备份 支持将本地信息库中的所有数据进行定期自动备份与人工备份。7.6.3 数据的保密 支持对互联网网站备案信息库中的敏感、关键内容进行密文存储和密文访问。权限管理功能 7.7 7.7.1 角色职能 支持对平台操作员按不同角色进行分类,每种角色对应不同的操作权限。7.7.2 操作权限 对权限进行分级,每种权限对应不同的操作功能。支持多用户在其权限范围内进行操作,在操作业务数据时相互独立。系统运行管理功能 7.8 支持对平台各功能模块进行实时监控,及时发现系统及功能异常情况,并自动告警。8 外部接口 通用接口 8.1 支持JSON、XML等常见数据协议向外部提供通用数据接口,同时支持从外部向本地平台导入数据。违规特征信息库接口 8.2 预留本地违规特征信息库与上级违规特征信息库内容保持同步的接口。监管平台之间通信接口 8.3 支持监管平台之间的互联互通与数据共享。