DB4401 T 12-2018 网络舆情分级与判定.pdf
《DB4401 T 12-2018 网络舆情分级与判定.pdf》由会员分享,可在线阅读,更多相关《DB4401 T 12-2018 网络舆情分级与判定.pdf(20页珍藏版)》请在麦多课文档分享上搜索。
1、 ICS 35.240.01 M 11 备案号: DB4401 广州市地方标准 DB4401/T 122018 网络舆情 分级与 判定 Classification and judgment for network public opinion 2018 - 10 - 10 发布 2018 -12 - 01 实施 广州市质量技术监督局 发布 DB4401/T 122018 目 次 前言 . 1 范围 . 1 2 术语和定 义、缩略 语 . 1 2.1 术语和 定义 . 1 2.2 缩略语 . 1 3 网络舆情 评价一般 流程 . 2 4 指标体系 . 2 5 指标量化 . 3 5.1 量化要
2、求 . 3 5.2 事件指 标 . 3 5.3 网民指 标 . 4 5.4 媒体指 标 . 5 5.5 舆情态 势指标 . 6 6 综合评价 . 7 7 等级划分 与风险程 度评价 . 7 7.1 等级划 分 . 7 7.2 结果评 价 . 8 附录A(资料 性附录 ) 文档 主题生成 模型 . 9 附录B(资料 性附录 ) 基于 层次分析法 (AHP)的 权重计算方法 . 12 I II DB4401/T 122018 前 言 本标准按照GB/T 1.12009给 出的规则 起草。 本标准由中 国共产党 广州市委 员会宣传 部提出并归 口。 本标准起草 单位: 广州市 网络舆 情信息中 心、
3、 广州市 标准化研究 院、 广州市云 润大数 据服务有 限公 司。 本标准主要起草 人:李 伟滨 、陈韶航 、徐湛、萧 玉珊 、王贺珍、郑裕 钊、曾庆 贤、林毅、 李永康、 陈敏华、陈 振兴、裴 炜。 本标准是首 次发布。 III DB4401/T 122018 网络舆情 分级与 判定 1 范围 本标准规定 了网络舆 情研判评 价的一般 流程、 指 标体 系、 指标量化 、 综合评 价、 等级 划分与风险 程 度评价等内 容。 本标准适用 于广州市 网络舆情 的监测、 评估、预 警及 相关软件开 发等。 2 术语和定义 、缩略语 2.1 术语和定义 下列术语和 定义适用 于本文件 。 2.1.
4、1 网民倾向性 Netizens tendency 网民对舆情 的评价和 态度取向 。 2.1.2 焦度 Focal power 舆情在传播 过程中最 受关注点 所处的状 态。 2.1.3 拐度 Flexion 舆情生命周 期中拐点 所处状态 。 2.1.4 网站的PR值 PageRank 全称为PageRank,是google搜索排名 算法中的一 个组 成部分,级别从1 到10级,10 级为满分,PR值 越高说明该 网页在搜 索排名中 的地位越 重要。 2.1.5 传播扩散度 Propagation diffusivity 影响网络舆 情信息安 全的重要 指标之一, 它用来刻 画 某一具体的
5、 舆情事件 或细化主 题的相关 信息在 一定的统计 时期内通 过互联网 呈现的传 播扩散状 况。 2.2 缩略语 下列缩略语 适用于本 文件。 AHP:层次分 析法(The Analytic Hierarchy Process) LDA:文档主 题生成模 型(Latent Dirichlet Allocation) 1 DB4401/T 122018 3 网络舆情评 价一般流 程 网络舆情评 价工作应 遵循一定 的流程, 主要包括 以下 三个环节, 如图1所 示: a) 舆情获取与 分析: 全面收 集数据并 获取网络 舆情源头 , 对涉穗数据进 行分类筛 选, 对影响因 素 进行细致辨 识;
6、b) 数据分析: 构建层次 结构的指 标体系, 选择科学 可行 的方法,进 行定性和 定量的数 据处理; c) 评价与措施 :对舆情 的危险程 度进行分 析,得出 评价 结果,给出 建议的处 理方法。 图1 网络舆情评 价一般流 程 4 指标体系 网络舆情评 价指标体 系包括事 件指标、 网民指标 、 媒 体指标、 舆情 态势指 标等, 这些 指标又 包含各 自的子参数,构 成了一个 层次的指标 体系,如图2 所 示。针对不同的 对象可选 择不同的指 标,包含但 不 限于这些指 标。 舆 情获 取与 分类 评 价与 措施 舆情 数据 获取 数据 信息 筛选 舆情 分类 建立 指标 体系 选定
7、评价 方法 定 性、 定量 分析 等级 划分 结果 评价 建议 处理 方法 数据 分析 网络 舆情 评价 一般 流程 2 DB4401/T 122018 图2 网络舆情评 价指标体 系 5 指标量化 5.1 量化要求 5.1.1 对网 络舆情评 价各指标 量化可采 用定性 或定 量的方法, 标度范围 为0,1。 5.1.2 对指 标定性量 化以评价 小组成员 的平均 值作 为最终量化 值。评价 小组成员 应受过专 业培训。 5.2 事件指标 5.2.1 事件 性质 P 11 事件 指标 (P1 ) 媒体 指标 (P3 ) 事 件性 质(P11 ) 事件 波及 度(P12 ) 事件 风险 度(P
8、13 ) 网民 活跃 度(P21 ) 网 民结 构(P22 ) 情感 倾向 度(P23 ) 媒体 权威 度(P31 ) 传播 扩散 度(P32 ) 网民 指标 (P2 ) 网络 舆情 评价 指标 体系 舆情 态势 指标 (P4 ) 传 播阶 段(P33 ) 热 度(P41 ) 关注 度(P42 ) 3 DB4401/T 122018 按照社会矛 盾产生的 原因对涉 穗舆情信 息主题进 行分 类, 通常包 括公共安 全、 群 体事件 、 重大灾 害、 官员负面、 经济 财经、 城市 治理、 意识形 态等。 事件 性 质可以通过 文档主题 生成模型 (LDA , 参见附录A) 进行聚类分 析,其它
9、 合适的分 析方法亦 可使用。 5.2.2 事件 波及度 P 12 网络舆情波 及度是衡 量所有网 络媒体中 涉及到相 关信 息网站的比 例指标。 这 一指标的 意义在于 评判 某一话题在 网络中传 播的广泛 程度, 或 网民在任 意登 陆一家网站 后能够获 取到相关 信息的概 率。 波及 度 为一个在0,1之间的 值,可由 公式(1 )计算。 1 1, 1 12 1 N ij ij N i i wS P w = = = = (1 ) 式中: P 12 波及度; N 1 表示涉及 到相关信 息的网站 数量; w i 表示网站 的权重; S j 表示网 站涉及到 与事件 相关的信 息程度; N
10、表示网 站总数量 。 5.2.3 事件 风险度 P 13 网络舆情信 息内容风险 度是指 某一特定 的网络舆 情信 息内容可能 造成的危 害程度, 与 评估者的 着眼 点密切相关, 如涉及 重大安全 事故、 重 大舆论危 机等 的负面舆情 信息内容 , 风险度 就较高。 其评判结 果 是通过专家 问卷调查 确定的, 可分为高风 险 、一般 风险 、无所谓 、不敏感 四档。 网络舆情信 息内容风险 度经过 专家问卷 调查确定 , 构 建层次分析 法 (AHP, 参见附录B ) 的判断 矩阵 建立。 5.3 网民指标 5.3.1 网民 活跃度 P 21 网民活跃度 通过单位 时间内发 布信息次 数
11、、回复 次数 来衡量,计 算方式见 公式(2)。 end start 21 () ( () ) t tt At P At N = = + (2 ) 式中: P 21 网民活跃度 ; A(t) 在t 时刻 相关事件 的网民活 跃值,见 公式(3 ); t end 最近更新时 间; t start 发布时间; N 平滑参 数,表示 网民活跃 值大于N 时具有 参 考价值。 1 () ( () ( 1 ) ) a N ii i i A t w Pt Pt = = (3) 4 DB4401/T 122018 式中: () At 在t 时刻相关 事件的 网民活跃 值; a N 网民行 为种类数 量; i
12、 w 各种 行为的权 重,权重 之和为1; () i Pt 网民在t 时刻对事 件发布的 信息、回 复等各种 对 信息的关注 行为次数 。 5.3.2 网民 结构 P 22 网民结构包 括年龄结 构、 教育程度 结构等多 个三级 指 标。 通过文本挖 掘技术的 智能分析, 得出一个 在0,1之间 的值,如 :判别式 方法、矢 量距离 法、 贝叶斯方法 、记分器 方法等。 经过问卷调 查、 专家确 定, 将网 民结构档 次分为四 档 , 分别是网民 结构不好、 一般、 好、 很好。 对 应的网民结 构得分如 表1所示。 表1 网民结构得 分表 网民 结构 档次 不好 一般 好 很好 得分 0,
13、0.25) 0.25, 0.5) 0.5, 0.75) 0.75, 1.0 5.3.3 情感 倾向度 P 23 网民情感倾 向度是民 众对现实 或社会问 题等态度 、 意 见、 看法、 要 求等主观 性综合反 映。 情感 倾向 度指标用以 刻画针对 某一特定 的网络舆 情信息, 民众 所持有的观 点态度 ( 即民意) 倾 向。 可以 通过对网 民回贴关键 字、褒贬 义词进行 分析,统 计出网民 对该 舆情情感倾 向的概率 分布。 5.4 媒体指标 5.4.1 媒体 权威度 P 31 媒 体权威 度衡量 了某个媒 体的可 信度和 影响力,是一个 网络媒 体的最 重要指标 之一,常以PR 值进行
14、表征,见公式(4)。它包 括了媒体的 性质(政府 , 综合大站,娱乐 大站,其 他),网站 新闻真实可 靠 的比例,以 及网民大 众对该网 站的关注 人数等。 31 10 PR P = (4) 式中: P 31 媒体权威度; 网站的PR 值, 可由站长 工具输入 网址得到 ,取值 范围为1,10。 5.4.2 传播 扩散度 P 32 指在一段时 间内, 网络舆 情在不同 网络媒体 中传播 的 速度, 媒体舆情 扩散度越 大, 网络媒 体影响力 也大。 传播扩 散度表征 了某网络 舆情信 息在一定 时间 内的变化趋 势, 可以反 映舆情信 息是在 海量的舆 情 信息中湮没 ,还是有 可能带来 舆
15、情泛滥 ,可以通 过公 式(5)进行 计算。 32 end start 123 1 1 100 P TT xxx = + + (5) PR 5 DB4401/T 122018 式中: P32 传播 扩散度; T end 最近的 一次观察 时间点; T start 之前的一次观 察时间点 ; x 1 T end -T start 网站新闻条数; x 2 T end -T start 微博中有关事件条数 ; x 3 T end -T start 微信中有关事件条数 。 5.4.3 传播 阶段 P 33 传播阶段包 括传播量、 传播权威 度、 传播 时间三个 指标 。 传播量为新 闻的全网 总数,
16、包 括新闻网 站、 微信、微博 。传播权 威度为新 闻传播网 站的媒体 权威 度,可以通 过公式(6 )进行计 算。 123 3 end start 33 2 1 1 xx x TT P a + = + (6) 式中: P 33 传播权威度; a 一般 情况下,a=1.2; x 1 网 站新闻条 数; x 2 微博中有 关事件条 数; x 3 微信中有 关事件条 数; T end 最近的一次观 察时间点 ; T start 之前的一次观察时 间点。 当P 33 0,0.2,那么该新闻处于萌芽期;当P 33 0.2,0.45,那么该新闻处于上升期;当P 33 0.45,1 , 那么该 新闻处于
17、爆发期 ; 当P 33 0.2,0.45, 那么 该新闻处 于下降期(经过爆 发期之后 下降 时);当P 33 0,0.2,那么该新 闻处于消 退期(经 过 爆发期之后 下降时)。 5.5 舆情态势指 标 5.5.1 热度 P 41 舆情关注度 一般用主 题下相关 网页的数 量来衡量。 可 通过改写过 的逻辑函 数Y降低数 量级作为 参数, 赋予每个不同类 别的新闻 数量一定的 权重,得到 新闻 的热度。热度指 数能客观 反映事件、 人物、品牌 、 地域等在互联网 上的受关注 程度。热 度指数所呈 现的 数值为0,1, 数值越大, 表明其网络 受关注度 越 高。热度计 算公式见 公式(7)。
18、4 1 1 1 22 33 44 P YbYbYbYb =+ (7 ) 式中: P 41 热度; Y 1 网站新闻的合成结果 ; b 1 Y 1 的权重系数,权重 比率为40% ; Y 2 微博的合成结 果; b 2 Y 2 的权重系数,权重 比率为45% ; Y 3 微信的合成结 果; b 3 Y 3 的权重系数,权重 比率为10% ; 6 DB4401/T 122018 Y 4 视频的合成结 果; b 4 Y 4 的权重系数,权重 比率为5% 。 2 1 1 i i x i Y a = + (8) 式中: Y i 第i 项新闻、 事件的合 成结果,i=1 、2、3 、4 ; a i 第i
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DB4401 12-2018 网络舆情分级与判定 12 2018 网络 舆情 分级 判定
