基于ElasticSearch和融合多源信息的地震信息推荐系统的设计与实现

known 发布于 2025-08-25 阅读(357)

摘" 要:近年来,随着地震相关技术的快速发展,地震行业对地震设备的管理要求越来越高。传统的管理系统,由于信息化和智能化程度不高,速度慢效率低,满足不了现代化管理要求。针对上述问题,文章分析了当前地震信息数据的特点,设计了基于ElasticSearch分布式数据库和融合多源信息的智能推荐算法,实现了高效的地震信息推荐系统。该系统克服了传统信息管理系统中查询速度慢,以及无法准确获取地震信息等问题,有着推荐精度高、快速查询等优点,具有较高的应用价值。

关键词:ElasticSearch;地震信息;智能推荐

中图分类号:TP311.1" 文献标识码:A " 文章编号:2096-4706(2024)22-0063-05

Design and Implementation of an Earthquake Information Recommendation System Based on ElasticSearch and Fused Multi-source Information

Abstract: In recent years, with the rapid development of the related technologies of earthquake, the management requirements for the earthquake equipment in earthquake industry have become increasingly higher. Due to the low level of informatization and intelligence, traditional management systems have slow speed and low efficiency, failing to meet the requirements of modern management. In response to the above problems, this paper analyzes the characteristics of current earthquake information data, designs an intelligent recommendation algorithm based on the ElasticSearch distributed database and fused multi-source information, and realizes an efficient earthquake information recommendation system. This system overcomes the problems of slow query speed and inability to accurately obtain earthquake information in traditional information management systems, and has the advantages of high recommendation accuracy and fast queries, and it is of high application value.

Keywords: ElasticSearch; earthquake information; intelligent recommendation

0" 引" 言

随着科技的快速发展,地震行业设备的数量和类型越来越多。这对地震设备的高效管理提出了更高的要求。然而,当前地震设备信息的复杂性、不透明和落后的管理模式,导致了在不同单位不同部门之间地震设备信息传递缓慢和管理人员进行统计管理的困难,同时限制了管理人员对地震设备信息的快速了解。针对以上问题,本文提出了一种基于ElasticSearch大数据搜索引擎和融合多源信息推荐算法的地震信息推荐系统[1],旨在重新构建地震信息数据,实现地震信息智能查询,并解决海量数据查询速度慢的难点[2]。采用ElasticSearch数据库可以高效的存储和检索地震信息,同时融合多源信息的推荐算法能根据管理人员的偏好[3],智能推荐其所需的地震信息数据。这将进一步推动地震信息管理的信息化进程,为地震行业提供更高质量和个性化的服务。

1" 相关工作

地震信息推荐系统的研究和应用在地震行业中具有重要意义。为了更好地解决当前地震设备管理面临的问题,本文对相关工作进行了分析阐述。

1)关于地震信息管理的研究较少。地震行业地震设备数量庞大且种类繁多,但目前设备管理状况和信息化水平相对落后。一些研究侧重于地震设备的监测和故障诊断[4],但设备信息的统一管理和信息交换仍待进一步研究。

2)推荐系统在其他领域有着广泛的应用,但在地震信息管理方面的研究相对较少。传统的推荐算法,如基于内容的推荐和协同过滤算法,在电子商务、社交媒体等领域取得了较大的成功[5]。然而,这些方法存在数据散射和冷启动等问题[6]。因此,有必要根据地震设备信息推荐的特点对算法进行优化。

3)ElasticSearch是一个分布式数据库,广泛用于信息检索和存储。ElasticSearch可以高效处理大规模数据,并提供实时搜索和索引功能[7]。许多研究中使用ElasticSearch来构建搜索引擎、信息检索系统等[8],例如在医疗领域中有着不错的体验。然而,在地震信息管理中的应用研究仍然有限。

综上所述,虽然在地震信息管理和推荐系统方面的研究相对有限,但仍存在许多相关的工作和方法可供参考。本文旨在结合ElasticSearch和融合多源信息的协同过滤推荐算法,提出一种创新的地震信息推荐系统,为地震设备管理提供个性化、智能化和高效的解决方案,并为未来的地震信息管理的研究提供参考。

2" 系统总体架构设计

系统采用基于浏览器和服务器的BS架构,提高系统舒适度、用户体验和可维护性[9]。该体系结构将系统分为两部分,即客户端和服务器,它们通过网络连接进行通信。

客户端部分是用户使用的浏览器,用户通过它与服务器进行交互。在客户端,通过设计直观且用户友好的界面,使用户能够轻松操作系统功能。用户无须进行烦琐的安装,只需打开浏览器并输入系统URL地址即可访问系统。

服务端部分是系统的核心,负责处理用户请求,存储和处理数据,为用户提供所需的服务。服务器依靠高性能的硬件和可扩展的软件架构,保证系统的稳定性和高度同步性。服务器端包括多个模块,如数据存储、业务逻辑处理、用户管理模块等。

通过用户角色权限控制机制,系统实现了多个客户端同时访问系统的目的。系统能根据用户的角色,进行认证和校验,确保用户只能访问自己有权限的数据、功能和页面等。用户角色权限控制机制能有效地保护系统安全,防止未经授权的用户访问敏感系统信息。

在系统设计上,系统采用表现层、逻辑层、数据访问层和数据库层四层架构,从而实现系统功能的清晰分离和高效运行。

基于BS架构系统提供了灵活、高效和安全的解决方案。用户通过浏览器与服务器交互,无须安装烦琐的客户端软件,服务器负责处理复杂的业务逻辑和数据处理,提供稳定可靠的服务。通过用户角色权限控制机制,系统可以保证用户只能访问有权限访问的数据、功能和页面等,以确保系统的安全性和稳定性。总体架构如图1所示。

3" 系统技术路线实现

本项目采用当前主流的前后台分离开发技术,基于MVVM的设计模式,应用Vue框架的开发平台,以SpringBoot作为后台框架,结合ES6的相关技术及其规范来进行应用开发;整个项目分为上下两层,分别为基础数据入库与多源信息体系构建和前端展示系统两部分。针对地震软硬件信息的特点和数据量的大小,本项目采用MySQL数据库的方法构建数据存储基础数据库,使用ElasticSearch大数据搜索引擎映射MySQL存储实现查询优化,应用Element技术结合Validate模块实现地震系统软硬件设备信息填报与汇总;在数据展示方面,应用Element技术和JavaScript开发方法进行Web前端展示实现地震系统软硬件设备信息展示;针对地震行业各个省局和部门的权限要求不同,采用基于用户访问权限模型应用RBAC的权限管理技术实现业务系统的整体的安全管理;在搜索功能上应用了融合多源信息的协同过滤推荐技术,可以根据不同的角色用户,在搜索时提供不同的搜索数据集。在导出数据方面采用EasyExcel技术,在Java后端进行数据导出,传到前端进行下载。具体系统技术路线如图2所示。

4" 主要技术应用

4.1" ElasticSearch全文检索

传统的检索技术基于MySQL进行查询,但是地震信息的数据量大,结构复杂,并且不同的数据需要不同的表结构来存储,多为一对多和多对多的关系,在查询时通常需要联表查询,导致速度很慢,并且随着数据量的增加,检索速度会进一步下降,用户的使用体验非常不好。针对以上问题,本系统采用ElasticSearch倒排索引算法对数据库中的地震信息数据进行索引建立。式(1)为该算法的性能模型:

式中,N表示倒排索引表中包含的地震信息词条总数,表长度的统计分布为p(i),x表示地震管理文档总数,d表示平均数据量值,q个查询指向N个管理信息词条中的某一个词条的数量范围为[1,k],对于某个词条上的不同查询操作数的概率记为fN,q(i),i = 1,2,…,k。

数据库中存储的地震信息数据包括结构化数据和非结构化数据。非结构化数据中主要包括部门地震信息资源文档等,这类数据不便于用关系型数据库进行存储,因此一般存放在非关系型数据库中[10]。为了使用ElasticSearch查询地震信息数据,首先需要为地震信息数据创建索引,其中对于文本数据需要进行特殊的分词处理。最终在ElasticSearch的索引库中,每条记录就是一个文档,其中包含多个不同的字段。系统最终的检索数据结果集就是在索引库中进行检索。

4.2" 融合多源信息的协同过滤推荐技术

在本系统中,通过融合多源的地震信息数据,来提升协同过滤智能推荐技术的性能。多源数据的获取渠道广泛,主要包括网络信息和实地考察两大主要来源。信息存储主要通过用户手动填表或通过API将数据导入数据库。数据结构包括结构化和非结构化数据。数据种类包括了软件设备和硬件设备。

数据扩样处理的方法,是对用户搜索需求的特征进行分析[11],之后根据传统的样本数据(用户的历史搜索记录),结合实际数据(如搜索设备类型、搜索设备所属单位、搜索设备所属部门等),进行数据扩样。数据扩样考虑原始规模,设定用户规模扩样系数为实际用户数除抽样用户数,历史搜索数据扩样系数为实际搜索设备总量除抽样设备总量。确保数据预处理后最大限度保留原始特征,避免不合理影响,保证数据真实性和可靠性。

目前推荐系统是现代系统和应用中不可否认的重要组成部分[12]。本文提出的地震信息智能推荐算法,通过对具有相似偏好的用户进行分类处理[13],再从分类后的用户范围内根据目标用户已知的历史交互数据向用户推荐项[14],来优化地震信息的选择过程。式(2)为该算法的核心公式:

式中,ai1,ai2,…,ain和aj1,aj2,…,ajn分别表示用户i和用户j的搜索设备类型、搜索设备所属单位、搜索设备所属部门和设备的历史搜索数据等。Kij表示用户i和用户j的搜索偏好相似度。按照这样的方式,分别计算样本数据集中任意两个用户之间的相似度关系,实现对相似偏好的用户分类。在完成对用户的分类处理后,把地震信息历史搜索记录作为目标用户地震信息推荐的结果集。

5" 系统详细设计模块

5.1" 信息资源管理模块

信息资源管理模块用于管理设备数据,主要功能为搜索、编辑、删除、查看详情和添加设备。为了便于用户进行管理,此页面有着多种查询功能,主要包括搜索、精确查询和保修期查询。搜索通过模糊全字段匹配进行全文查询数据,便于用户快速了解地震设备详细信息;精确查询,可以根据用户对特定数据的需求,选择指定字段进行精确查询数据。保修期查询,通过设备保修时间字段查询相关地震设备数据,保证设备的安全性。信息资源管理界面如图3所示。

5.2" 用户管理模块

用户管理模块主要基于角色—权限—资源—用户的权限控制(RBAC)进行权限管理。该模块旨在实现对不同用户角色的页面访问权限进行管理,从而确保不同角色仅能访问其被授权的页面。角色分为超级管理员、单位管理员、部门管理员和一般管理员。超级管理员可以对所有用户进行修改、删除和冻结操作。用户信息管理和角色权限管理界面如图4、图5所示。

5.3" 地震设备信息推荐模块

本系统核心是用户及时了解所需的地震设备信息,传统的检索不仅时间长,且查询结果根据设备编号排序展示。为了精确推荐给用户需要的地震设备信息,本模块采用基于用户的协同过滤推荐算法,对用户多次检索的内容进行收集,并多维度分析,再结合构建的地震信息数据库与协同过滤推荐算法,从用户角色、用户单位以及用户部门进行多角度分析,对用户访问量高的地震信息设备优先排序展示,提高推荐给用户所需地震设备信息的准确性。界面如图6所示。

6" 系统测试

6.1" 检索性能测试

响应时间是反映系统综合性能的一项重要指标。为了验证基于ElasticSearch和融合多源信息的地震信息推荐系统的响应时间,本文选取MySQL和ElasticSearch数据库通过全局搜索,精确查询和保修期查询操作进行了测试。每个检索的测试次数为50次,最后计算50次响应时间的平均值作为最终的响应时间。响应时间测试结果如表1所示。

如表1所示,测试结果表明:三种检索方式选用ElasticSearch数据库查询的平均响应速度都在1 s内,采用MySQL数据库查询的平均响应时间在3 s以上,表明在系统多维度查询上,使用ElasticSearch能够更快速地震信息,提高用户的使用体验。

6.2" 推荐准确度测试

推荐精确度(ACC)是反映系统推荐算法应用效果的重要指标之一。本文使用ACC指标对基于用户的推荐算法、基于内容的推荐算法和协同过滤推荐算法进行了推荐准确度测试。ACC值越高,代表推荐算法的准确度越高。推荐准确度对比测试如表2所示。

如表2所示,测试结果表明:协同过滤推荐算法的推荐算法精确度高于基于矩阵分解与基于内容的推荐算法,准确度达到91.2%,表明本系统采用基于协同过滤的推荐算法能够更加准确获取用户所需的地震信息。

7" 结" 论

经过本文的研究,基于ElasticSearch和融合多源信息的地震信息推荐系统可以为用户提供高效的服务,有效解决了传统信息管理系统中查询速度慢与无法准确获取地震信息等问题。通过融合多源信息的协同过滤推荐算法和基于ElasticSearch的分布式数据库,本系统能够准确地根据用户的需求,推荐其所需的地震信息数据。

这项研究仍有改进的地方。下一步的研究方向将侧重于进一步改进推荐算法,以提高推荐性能,为用户提供更好的服务。计划在推荐算法上,考虑设备历史性能、用户偏好、实时需求等更多因素,进一步提高推荐结果集的准确性。

参考文献:

[1] 何登平,张为易,黄浩.基于多源信息聚类和IRC-RBM的混合推荐算法 [J].计算机工程与科学,2020,42(6):1089-1095.

[2] 陈东辉,高峰,刘娜,等.气象台站历史沿革信息检索可视化系统设计与实现 [J].计算机应用,2021,41(S1):119-124.

[3] 姚彬修,倪建成,于苹苹,等.基于多源信息相似度的微博用户推荐算法 [J].计算机应用,2017,37(5):1382-1386.

[4] 师宏波,王坦,张锐,等.地震站网运行监控关键技术分析与实践 [J].中国地震,2023,39(3):650-662.

[5] KUMAR M S,PRAKASH O R,KUMAR A S,et al. Implementation of Knowledge based Collaborative Filtering and Machine Learning for E-Commerce Recommendation System [C]//3rd International Conference on Computational amp; Experimental Methods in Mechanical Engineering ICCEMME (2021).Uttar Pradesh:IOP,2021,2007(1):012032.

[6] 毛骞,谢维成,乔逸天,等.推荐系统冷启动问题解决方法研究综述 [J].计算机科学与探索,2024,18(5):1197-1210.

[7] KATHARE N,REDDY O V,PRABHU D V.A Comprehensive Study of Elastic Search [J].Journal of Research in Science and Engineering,2022,4(11):34-38.

[8] 董元和,贾炎,朱勇,等.基于ElasticSearch分布式搜索引擎的信息检索方法研究 [J].湖北师范大学学报:自然科学版,2023,43(4):56-61.

[9] 徐小辉,刘江涛,高涵,等.基于SpringBoot+Vue框架的采气方案系统开发 [J].计算机仿真,2021,38(6):248-250+382.

[10] 郭翠娟,李思佳.基于ELKB日志管理系统的应用 [J].科学技术与工程,2024,24(3):1146-1153.

[11] 苏跃江,温惠英,韦清波,等.多源数据融合驱动的居民出行特征分析方法 [J].交通运输系统工程与信息,2020,20(5):56-63.

[12] SHOKRZADEH Z,FEIZI-DERAKHSHI M-R,BALAFAR M-A,et al. Knowledge Graph-Based Recommendation System Enhanced by Neural Collaborative Filtering and Knowledge Graph Embedding [J/OL].Ain Shams Engineering Journal,2024,15(1):102263[2024-02-26].https://doi.org/10.1016/j.asej.2023.102263.

[13] 侯立,王健.基于协同过滤的用户大数据周期智能推荐算法 [J].计算机仿真,2023,40(3):476-479+489.

[14] LU D L,ZHU D J,DU H W,et al. Fusion Recommendation System Based on Collaborative Filtering and Knowledge Graph [J].Computer Systems Science and Engineering,2022,42(3):1133-1146.

标签:  用户 

免责声明

本文来自网络,不代表本站立场。如有不愿意被转载的情况,请联系我们。

iidomino cuppor