王勇,吴胜益,赵恢华,黄伟
(江西警察学院 科技与信息安全系,江西 南昌 330103)
0 引 言随着社会经济的快速发展,人们的时间碎片化越来越明显,对娱乐资讯的需求越来越广泛、精简,视频网站、APP愈发受大众青睐。许多视频网站、APP都因其资源库品类丰富或用户体验良好等优势而在同类产品中脱颖而出,弹幕作为一种新兴功能,日益成为各大平台用户的新宠。弹幕具有很高的实时性和直观性,为的是让用户能够在对强画面进行有针对性的发言中获得快乐。但随着弹幕功能的普及,弹幕也因其互动性高这一特点而反映出许多问题:暴力、低俗、谣言、三观不正等内容充斥屏幕。这些问题不仅影响其他用户的体验,而且严重损害文明和谐的网络氛围。网络用户呈现低龄化趋势,如不对弹幕环境进行有力的监管,将会在很大程度上影响未来网络环境的发展。针对弹幕环境引发的一系列问题,“智监弹幕宝”APP应运而生。这款APP将作为辅助APP智能化监管弹幕内容,最大限度地保护弹幕环境,打造一个优质的弹幕环境,提升用户的观赏、互动体验。独特的监管功能可在一定程度上减少弹幕来源,及时将违法弹幕推送至公安系统,缓解监管系统的压力。用户可以针对违法弹幕进行举报,实现弹幕内容绿色化,同时最大限度地保留弹幕应有的特色。
1 功能设计为了保证用户信息的可信度和可追溯性,智监弹幕宝APP需要用户实名注册并进行手机绑定。APP功能设置主要分为以下四个栏目,功能构思框架图如图1所示,APP运行框架图如图2所示。
图1 功能构思框架图
图2 智监弹幕宝APP运行框架图
1.1 APP详细介绍1.1.1 APP登录
图3中的黑白色箭头指向本APP的图标,首次登录的用户点击图3中的图标,便可进入图4软件账号登录注册界面。
图3 智监弹幕宝APP的图标
图4 登录界面
1.1.2 APP功能简介
“智监弹幕宝”APP的首页总共有四个模块,分别是首页、消息、搜索、我,如图5所示。四个模块分别有着不同的子功能系统,该APP通过每一个功能以及衍生出的子功能更好地服务于大众用户以及相关的执法部门,为建立一个健康、双向信息传导的视频弹幕环境提供一剂清新剂。
图5 首页
如图6所示,对首页中四大功能(弹幕监测、弹幕推送、弹幕举报、非法弹幕库)中弹幕监测的相关子功能进行介绍,分为两个子功能:弹幕预警和弹幕上报。弹幕预警即为智监弹幕宝APP对用户手机上的各大视频软件(如B站、爱奇艺视频、腾讯视频、网络直播平台等)上的弹幕内容进行监测,若监测到的内容属于违规内容(政治敏感词、淫秽言语、攻击中国共产党、侮辱国家等内容),该监测机制将进行弹幕预警,随即通过另外一个子功能——弹幕上报,将违规内容在“信息”模块中呈现,接下来通过“弹幕推送”功能进行下一步的处理。
图6 弹幕监测界面
例如,在B站上,某个ID为“某某华”的用户于2020年5月18日13:01:02时在某UP主视频中通过弹幕发送一条关于邪教的言语——“法轮大法好”。其他用户通过智监弹幕宝APP对这一弹幕内容进行违规内容确认后即可将该弹幕内容上报至“信息”栏,进入下一步的对接公安机关网络上的治安工作。
如图7所示,对首页四大功能(弹幕监测、弹幕推送、弹幕举报、非法弹幕库)中弹幕推送的相关子功能进行介绍,这里的“弹幕推送”实则包括两大块:其中一块属于言语健康、内容正常的弹幕言论,我们将这一块的弹幕内容推送至各ID主发布的视频软件平台,供大众用户相互交流。另外一块则属于非正常的弹幕内容(如上图所示的“法轮大法”“淫秽言语”“敏感词汇”),对智监弹幕宝来说,对这一块的处理属于创新点,我们可以将非法内容以及发送相关内容的ID信息及时推送给相关的执法部门,执法部门凭借这些信息就可以对相关人员采取相应的治安管理措施,例如:封号、传唤,对思想偏激严重的人进行刑事案件的立案侦查等。
图7 弹幕推送界面
如图8所示,对弹幕举报功能进行介绍。用户在使用手机视频软件时如发现其中含有非法内容或是不健康的内容,可以在智监弹幕宝APP中的“弹幕举报”上进行举报,输入“视频软件的名称+视频所在的房间+发送者ID号+发送时间+发送的内容”即可完成举报,举报后会有一个来自执法部门的处理反馈信息,这是一个极为重要的功能,有效地维护了用户的相关权利。
图8 弹幕举报界面
非法弹幕库的建立:非法弹幕库的建立是智监弹幕宝APP的关键所在,采用先进的大数据进行建模,主要是使用网络爬虫从各大视频应用软件页面中采集非法弹幕信息,对互联网信息中的敏感字词以及用户发布的弹幕进行爬取。网络舆情分析不仅需要对当下所有的网页及其呈现的所有内容进行捕获以保证建立的非法弹幕库的全面性,还要保证非法弹幕库里面内容的准确性,对所捕获的网页非法内容进行分析归类,使APP工作时能够快速准确地进行比对排除;另外,对非法弹幕库捕获的非法网页链接进行深度爬取,从而获得更多维的参数和网页源文件。
非法弹幕库的存储:对非法弹幕库收集到的相关信息进行分析、去重等处理,然后根据类别和属性进行归类,以便在使用APP时可以更好地进行识别和检索比对。由于各大视频(如B站、爱奇艺、腾讯视频等)网页结构各不相同,因此需要去除与文本无关的HTML源码,并保留网页标题、内容摘要、发布时间、评论等与非法弹幕相关的信息。过滤掉收集的正常网页、内容以及收集时产生的误差信息,留存已经纳入非法弹幕库的非法弹幕,并将其保存到HDFS分布式文件系统中,对非法弹幕进行有效的存储。
1.2 APP“信息”栏简介如图9所示,智监弹幕宝APP所有的信息反馈,主要来源于功能模块中弹幕监测及后续公安机关对违规发送弹幕的ID实名认证人的处理信息,另外一部分信息则是手机用户对违规弹幕举报的反馈信息、与该款APP开发商联系的信息(可提供对智监弹幕宝的建设性意见)。
图9 信息界面
1.3 APP“热点搜索”栏简介如图10所示,智监弹幕宝APP自动实时推送弹幕热点信息,用户也可以自主搜索该时间下网络上关于某一热点的详细信息、新闻的实时动态。
图10 热点搜索界面
1.4 APP“我”栏在智监弹幕宝APP中还具有“我”这一栏,主要是满足个人信息、账号安全、设置、关于以及退出登录等相关应用,如图11所示。
图11 “我”界面
2 系统开发技术智监弹幕宝APP的开发需要满足所有系统都能下载,在开发平台、数据处理、实验产品设计平台、服务器数据结构等方面都做出了相应的要求,具体内容为:
(1)开发平台介绍。本项目采用Hybrid APP技术(混合框架的APP设计模式),主要技术为HTML5+JAVASCRIPT+MapReduce交互技术,Hybrid APP的优势是可以实现跨平台性,兼容PC端与移动端、Windows与Linux、安卓与IOS。
(2)数据处理:Hadoop平台
存储数据:HDFS分布式文件系统
分析预测:HTML5+JAVASCRIPT+MapReduce交互技术
编程语言:Javascript语言
(3)本项目所设计的APP实验产品是在APICloud中设计完成的,这是一款“云端一体”的移动开发平台,如图12所示,利用平台提供的“云”和“端”两个方向来提供API,引擎框架一般使用HTML5和Javascript作为编程语言。可以实现服务器数据的云托管,为APP设计提供较好的实验环境。
图12 APICloud平台示意图
(4)服务器数据结构。将需要服务器维护的信息、需要客户端与服务器不断请求的信息(如案件位置信息、用户认证信息、新闻发布信息等)存储在远程服务器端。远程服务端数据库主要包括5张表信息和两张数据字典信息,如图13所示。
图13 服务器数据结构图
3 结 论近年来,随着互联网上各大视频软件企业的发展,我国已经进入大众麦克风时代。弹幕字幕的存在早已为人所熟知,它是将视频中出现的对话或者旁白用文字的方式呈现在视频中。但现在的字幕可不一定就是剧中人的对话,还可能是大众浏览者的弹幕。弹幕是一种即时评论,它会立刻显现在正在播放的视频中,把对影视作品的评论从“看完再说”变成了“同步进行”,这些评论从屏幕飘过时,效果看上去像是飞行射击游戏里的子弹,因而被称为“弹幕”。作为一种即时互动方式,它不仅增加了社交性和趣味性,更是信息的双向传递。正是因为这种“自媒体”式的双向信息传播,需要我们对其进行监测和管控,“智监弹幕宝APP”可以更好的解决这一“云”问题。