【摘要】近年来, 上市公司财务舞弊手段不断演进升级, 呈现出动机多样化、 手段系统化、 手法隐蔽化、 主体集团化、 跨期长等新特征, 导致传统财务舞弊识别预警面临挑战。与此同时, 在数字经济时代, 日益发展成熟的大数据和人工智能技术催生出新的机遇, 赋能财务舞弊识别预警数智化转型。基于此, 本文探索了数智化财务舞弊识别预警框架和模型, 并从数据层、 指标层、 模型层和应用层四个层面分析如何构建数智化财务舞弊识别预警体系, 旨在为行业内探索财务舞弊识别预警数智化升级提供参考, 并助力我国上市公司高质量发展。
【关键词】数智化转型;财务舞弊;识别预警模型;识别预警体系
【中图分类号】 F275" " "【文献标识码】A" " " 【文章编号】1004-0994(2025)08-0016-7
一、 引言
上市公司作为资本市场的基石, 在资本市场高质量发展中起着至关重要的作用。然而, 在发展过程中财务舞弊案件屡见不鲜, 影响了市场资源配置功能, 损害了投资者的利益及其对资本市场的信心, 2020年瑞幸事件甚至产生了巨大的社会影响, 严重破坏了我国上市公司的整体诚信。上市公司财务舞弊行为引发了监管机构及市场的高度关注, 如2020年国务院发布《关于进一步提高上市公司质量的意见》, 2024年国务院印发《关于加强监管防范风险推动资本市场高质量发展的若干意见》、 中国证监会发布《关于严格执行退市制度的意见》、 中国证监会等六部门联合发布《关于进一步做好资本市场财务造假综合惩防工作的意见》等, 体现了政府在财务舞弊方面的监管力度和决心, 为我国证券市场监管提供了依据。同时, 监管持续加强对重点领域涉及财务造假风险问题的排查, 从严惩处财务造假、 侵占资金、 第三方配合造假行为, 强化震慑效应。中国证监会的数据显示: 2024年1 ~ 10月共查办财务造假案件658件, 罚没款110亿元, 已超过2023年全年; 2021 ~ 2023年共办理上市公司信息披露违法案件397件, 其中财务造假案件203件。
在此背景下, 各市场参与单位不断加强财务舞弊识别预警实践, 但仍有诸多尚未解决的难题, 例如: 如何挖掘更为隐蔽的财务舞弊手段, 如何提升财务舞弊识别预警效率, 在数智化时代如何更为精准地识别预警财务舞弊, 如何构建更为贴近实际、 可实操落地的财务舞弊预警模型等。本文基于近年来上市公司财务舞弊现状, 剖析当前财务舞弊行为的新变化以及信息技术发展给财务舞弊识别预警带来的新机遇, 进而提出财务舞弊识别预警数智化转型路径。
二、 文献综述
《独立审计具体准则第8号——错误与舞弊》中提出, 舞弊是指致使会计报表产生不实反映的故意行为; 《中国注册会计师审计准则第1141号——财务报表审计中与舞弊相关的责任》进一步细化, 提出舞弊是指被审计单位的管理层、 治理层、 员工或第三方使用欺骗手段获取不当或非法利益的故意行为。目前关于财务舞弊的理论研究, 主要集中在动因分析和识别预警方面。
1. 财务舞弊动因。源自心理学的双因素(冰山)理论将舞弊动因分为“露出海平面”容易被观察和识别的结构部分, 以及“潜藏在海平面下”被掩饰的更庞大更危险的行为部分。三因素(舞弊三角)理论认为舞弊产生的原因由动机/压力、 机会、 借口三要素组成, 企业或个人在追求自身利益或存在业绩目标等压力时, 若同时存在内部控制薄弱、 信息不对称等机会, 且能够为舞弊行为找到“合理化”的借口, 就可能实施舞弊。四因素(GONE)理论则进一步将舞弊动因区分为贪婪、 机会、 需求、 暴露四类, 贪婪和需求驱使舞弊动机产生, 机会为舞弊行为提供了实施条件, 而暴露风险的大小则影响对舞弊后果的预期, 进而据此决定是否实施舞弊。在此基础上, Bologua(1993)进一步加入了舞弊受罚的性质与程度因子, 王杏芬和张彧(2020)将机会因子细分为形式化的公司治理和无效的内部控制, 将暴露因子细分为内外部监管机制时效和与第三方合谋。多因素(风险因子)理论认为舞弊动因由与组织相关的一般风险因子(包括行业环境、 内部控制制度、 公司治理结构等)以及与个人相关的个别风险因子(包括个体的道德品质、 价值观等)组成, 目前该理论被认为是最完善的舞弊动因理论。
2. 财务舞弊识别预警。在预警框架方面, 从一开始的预警信号研究(黄世忠和黄京菁,2004)逐步演变到识别框架研究(叶钦华等,2022), 识别框架更为体系化地介绍了财务舞弊识别预警方法论, 从财务税务维度、 行业业务维度、 公司治理维度、 内部控制维度和数字特征维度进行财务舞弊识别。随着大数据技术和人工智能的发展, 预警模型在传统的常规量化分析方法, 如Logistic回归(洪文洲等,2014)、 主成分分析(钱苹和罗玫,2015)等的基础上, 逐步引入新兴算法, 如神经网络模型(Fanning和Cogger,2015)、 机器学习(包括支持向量机和随机森林等)(刘云菁等,2022)、 元学习(张学勇和施懿,2023)等, 模型迭代及算法升级提高了财务舞弊识别预警的准确性。预警模型变量也在简单的财务原始数据、 财务指标波动(洪文洲等,2014)、 财务衍生指标(李清和任朝阳,2016)等的基础上逐步加入非财务变量, 如公司市场因子(Dechow等,2011)、 治理特征(姜富伟等,2023)、 文本分析指标(Brown等,2020)、 生产数据(叶康涛等,2021)、 递延所得税指标(郦金梁等,2020)等, 引入了更多的舞弊识别变量, 使得财务舞弊识别预警维度更加多样、 全面。
从理论研究情况来看, 专家学者们基于双因素、 三因素、 四因素、 多因素理论, 搭建了财务舞弊识别预警模型, 指标变量从定量指标逐步扩充到定性指标, 识别模型从传统逻辑回归等逐步转变为神经网络、 机器学习等新兴算法, 持续提升了财务舞弊识别和预警的“精度”, 但仍存在改进空间。一方面, 现有模型预警指标变量有所增加, 但模型变量与舞弊手段之间未建立关联, 特别是一些组合式、 场景式的舞弊手段并未在相应识别模型中予以体现, 理论和实践存在一定程度的脱节; 另一方面, 在大数据、 智能化时代背景下, 相关机构如何拓宽变量获取的来源和方式、 构建数智化财务舞弊识别预警框架和分析模型等, 仍有待进一步深入探讨。
三、 财务舞弊新变化
随着科学技术的发展和内外部环境的变化, 上市公司财务舞弊手段不断演化升级, 大体可划分为四个阶段。一是财务舞弊1.0阶段: 只关注利润表。企业主要通过虚构无商业实质的业务虚增收入, 并通过虚增返利、 少计费用、 费用跨期等达到虚增当期净利润的目的, 后续再通过计提减值, 逐步消化虚增的应收账款。该阶段的财务舞弊形式相对简单, 一般不涉及现金流造假, 可通过经营现金流和利润表匹配来判断。二是财务舞弊2.0阶段: 净利润造假, 同时关注现金流。企业在收入、 费用方面的造假手法与上一阶段基本一致, 但在现金流方面, 一般通过体内资金循环, 虚构经营性现金流入。该阶段收现比、 净现比等指标失效, 但结合常识如存贷双高、 利息收入与货币资金不匹配等, 可发现端倪。三是财务舞弊3.0阶段: 净利润造假, 调整现金流。这一阶段的舞弊手段更加丰富, 最为常见的是通过虚构业务、 虚设客户、 虚签合同、 虚减成本、 虚构存款等达到虚增收入和利润的目的。资产负债表方面, 主要涉及货币资金、 应收账款、 存货、 其他应收款等科目。现金流方面, 企业往往与外部第三方配合调整经营现金流入和流出。从该阶段开始, 舞弊手段逐渐逼真, 单一预警指标已无法使用, 更依赖于行业对比、 场景式舞弊预警。四是财务舞弊4.0阶段: 净利润造假, 同时现金流造假。企业舞弊手法更加系统化, 通过虚创业务、 虚设客户、 虚构资金等手段虚增收入和利润。资产负债表方面, 除了上述科目, 还会涉及在建工程、 商誉、 无形资产等科目。现金流方面, 除了经营现金流造假, 还对投资活动现金流等进行造假。
从近三年上市公司财务舞弊案例来看, 当前上市公司主要采用财务舞弊4.0阶段的手段, 舞弊行为贯穿利润表、 现金流量表和资产负债表, 形成财务舞弊闭环, 呈现出如下新特征:
1. 动机多样化。除了传统资金压力、 业绩承诺等, 上市公司舞弊动机更加多元化, 如大股东减持套现、 掩盖资金占用、 市值管理、 退市压力等。例如, 仁东控股2021年被调查出股东坐庄股票的违法事实, 而后监管进一步调查发现, 公司在2019 ~ 2020年虚增收入和利润, 存在以财务舞弊配合公司股东坐庄的嫌疑。
2. 手段系统化。财务舞弊不再拘泥于使用单一手段, 而是多种舞弊手段一并实施, 各环节紧密配合, 且趋于复杂化、 系统化、 全链条化。例如: ST金刚在收入端通过虚构销售交易及股权转让交易, 虚增营业收入、 利润总额; 在资产端通过虚构采购交易等, 虚增存货、 固定资产等非流动资产; 在资金端通过虚构采购业务、 支付采购款、 账外借款及开具商业汇票等, 向实际控制人及其关联方提供资金, 构成非经营性资金占用。
3. 手法隐蔽化。上市公司利用新型或复杂金融衍生工具、 理财产品、 跨境业务等, 采用多层嵌套股权结构, 使得关联交易非关联化, 借助第三方假账真做、 真真假假, 使传统方式与新型手法杂糅共生, 更为隐蔽地开展财务舞弊。例如, 天目药业的控股股东长城集团成立文韬基金、 武略基金, 再将上述基金虚假转让给天目药业控股子公司银川天目, 从而以股权转让的方式侵占上市公司天目药业的资金。
4. 主体集团化。例如, 2021年上海电气披露子公司“专网通信”业务爆雷后, 牵扯出A股ST凯乐等10多家上市公司, 专网通信造假以“窝案”方式实施, 借助配合造假、 融资性贸易、 空转等构建造假“生态圈”(叶钦华和黄世忠,2024)。此外, 部分上市公司大股东控制了多家上市公司, 其通过资金池管理、 繁复的内部关联交易等对上市公司进行资金占用, 跨地区、 跨国舞弊增加。
5. 跨期长。财务舞弊不再是短期、 一次性的操作, 出现了长期财务舞弊、 跨期逐步调整的情况。例如, ∗ST美尚在2012 ~ 2019年以及2020年上半年均存在虚增净利润的情况, 横跨公司上市前(2012 ~ 2015年)、 后(2016 ~ 2020年), 财务舞弊持续了8年之久。
上述财务舞弊新特征导致财务舞弊识别预警难度加大, 舞弊行为从发生到最终被发现和处罚, 存在较长时滞, 在此期间, 舞弊公司往往继续在资本市场上吸引更多的资金流入。按照退市新规, 财务舞弊公司或面临退市风险, 投资者将遭受巨大损失, 对资本市场资源配置产生严重负面影响, 阻碍资本市场的健康发展。
四、 数字技术发展给财务舞弊识别预警带来新机遇
2021年国务院办公厅发布《关于进一步规范财务审计秩序促进注册会计师行业健康发展的意见》, 提出“加强财会监督大数据分析, 对财务造假进行精准打击”。在数字经济时代, 日益发展成熟的大数据和人工智能技术使人们的生产生活发生了巨大变化, 也为赋能财务舞弊识别预警数智化转型催生出新的机遇。
1. 高频、 海量、 多元化数据为财务舞弊识别预警数智化转型奠定基础。财务舞弊新变化带来了数据扩延需求。在财务舞弊涉及的主体方面, 逐步由“个案”向“窝案”转变, 关联方、 第三方等配合“交易造假”, 面对财务舞弊手段的演进, 需进一步延伸核查主体范围, 识别隐性关联、 分析交易链条、 支持财务数据下钻穿透等, 这些需求与日俱增。在财务舞弊手法方面, 逐步由“无中生有”向“假账真做”“真假参半”等转变, 亟需进一步扩展入模数据范围, 不仅包括财务及生产数据, 还需引入内部控制、 企业治理、 负面舆情等非财务数据、 非结构化数据, 以进行交叉论证。因此, 若需提升财务舞弊识别预警的效率和准确性, 首先要提升输入数据的广度和深度。
在大数据时代, 数据已逐步演变为新的生产要素。借助光学字符识别(OCR)、 自然语言处理(NLP)等技术, 在结构化数据的基础上获取公告、 裁判文书、 新闻、 演讲等所涉及的非结构化数据、 半结构化数据等, 在低频财务数据的基础上获取工商、 诉讼、 舆情、 市场等高频海量数据, 汇集多源异构数据构建高质量数据集, 延展数据广度、 深度及颗粒度, 有利于挖掘更多价值信息, 这为财务舞弊识别预警数智化转型奠定了基础。
2. 大数据存储、 云计算等技术为财务舞弊识别预警数智化转型提供技术支持。财务舞弊新变化带来了多源、 多维、 异构数据的挖掘分析需求。单纯依赖于财务指标或单个维度信号, 往往难以及时识别预警财务舞弊。由于公司运营仍然在一定的逻辑框架内运行, 遵循财务、 税务、 公司法等各类管理要求, 公司财务舞弊实施后往往会在财务、 税务、 生产、 内部控制等方面留下“痕迹”, 这就需要基于上述高质量数据集, 进行多维度、 组合性、 交叉式的深入分析和挖掘。
随着当前信息科技的发展, 分布式计算架构、 分布式批处理计算框架、 分布式流计算系统、 图分析图计算等大数据技术快速迭代演进, 加之云计算强大的存储、 计算和分析能力, 使得财务舞弊识别预警可打破数据边界, 基于多源、 多维、 异构的数据进行深入挖掘与分析, 为大容量、 高并发、 高效率计算的数智化财务舞弊识别预警提供技术支撑。
3. 人工智能、 机器学习等技术助力构建更为精准的财务舞弊“画像”。高频海量数据在一定程度上使得传统财务舞弊识别预警走入困境。高频海量数据是一把“双刃剑”, 更多的数据支持交叉验证在一定程度上提高了财务舞弊识别质量, 但同时由于上市公司存在众多财务项目及报表附注信息, 加之监管处罚、 诉讼、 行业等海量信息, 数据广度、 宽度、 深度等呈几何倍数增长, 导致根本无法依赖人工全面识别预警财务舞弊。
随着人工智能、 机器学习等技术的逐步成熟并在实践中应用, 以及新兴算法的迭代优化, 持续对大数据进行高效处理、 挖掘、 分析并形成价值输出, 极大地弥补了人脑在处理和分析海量、 非结构化、 隐蔽数据方面能力的不足, 同时, 改变了传统的一因一果、 多因一果的因果思维。借助人工智能、 机器学习等技术, 能够突破常规认知, 挖掘潜在数据价值, 洞察复杂的多对多因果关系、 关联关系, 反哺提升财务舞弊识别预警准确性, 这是对传统人工识别方式、 打分卡等模型的重塑和升级。
在传统财务舞弊识别预警面临新挑战、 数字技术发展给财务舞弊识别预警带来新机遇的综合作用下, 财务舞弊识别预警数智化转型应运而生。所谓“数智化”, 是继线上化、 系统化、 数字化发展后的高阶阶段, 是一个基于海量数据资源、 高阶智能算法应用和智能技术赋能的新模式, 是“数据+算力+算法”“数字化+智能化”等融合创新的产物。相较于传统财务舞弊识别预警, 数智化财务舞弊识别预警在数据挖掘、 分析算法、 预警质效、 风险评估等维度均产生了系统化变革, 详见表1。
五、 财务舞弊识别预警数智化转型
1. 数智化财务舞弊识别预警框架。财务舞弊并非突然而至的“黑天鹅”事件, 往往有迹可循, 且是一个动态变化的事件。结合上述分析, 本文拟从如下三大视角搭建数智化财务舞弊识别预警框架: 一是经营活动视角。对上市公司日常生产、 销售、 回款、 筹资、 对外投资等经营活动及其产生的各种财务、 税务、 生产数据中的异常进行甄别, 构建企业经营识别预警模型(模型1); 同时, 通过行业对比, 从行业趋势及结构偏离角度构建行业偏离识别预警模型(模型2)。二是内部控制视角。良好的内部控制机制是保障财务、 税务等数据能够真实、 客观地反映公司各项经营情况的基础, 反之, 失衡的内部控制生态往往是滋生财务舞弊的“温床”。从舞弊动因分析角度构建舞弊压力识别预警模型(模型3); 同时, 基于上市公司内部环境和行为分析其内部控制生态, 构建内部管理识别预警模型(模型4)。三是外部监督视角。监管机构、 审计机构、 投资者等第三方主体对上市公司财务数据真实性进行监督, 其输出的公司负面信息是重要的预警信号, 基于此构建外部监督识别预警模型(模型5), 其包括外部监督预警和舆情雷达两个子模型。
其中, 模型1、 模型2和模型5中的舆情雷达子模型通过交叉矩阵输出财务舞弊识别预警初始等级及其画像, 模型3、 模型4和模型5中的外部监督预警子模型通过交叉矩阵形成叠加因子对识别预警初始等级进行调整, 形成最终的财务舞弊识别预警结果。
2. 数智化财务舞弊识别预警模型。
(1) 模型1: 企业经营识别预警模型。该模型可从财务、 税务、 生产三个维度进行识别预警。在财务维度, 上市公司必须参照财务报告概念框架、 会计准则等, 按照相对统一的标准编制财务报表。因此, 若公司虚构交易事项, 或有意选择或变更会计政策与会计估计方法, 或未遵循会计准则, 将会导致财务报表数据出现异常, 留下诸多“痕迹”, 而这些异常现象可用于财务舞弊的识别预警。在税务维度, 上市公司依据税法相关规定申报纳税, 具有更强的刚性约束, 因此财务舞弊形成的虚增收入、 利润等往往会产生纳税成本, 企业规避税务成本将会产生较大的纳税异常或递延所得税异常变动。在生产维度, 企业经营活动将同步生成生产数据, 更加贴近公司真实情况, 生产数据与财务数据的背离往往意味着财务舞弊。例如, 公司在产品价格基本稳定、 无重大生产线投入的情况下, 人均产能、 人均净利润突然大幅攀升, 而员工人均收入出现下降。
对于上述三个维度, 可从以下三个方面设置相应的识别预警指标输入财务舞弊识别预警模型: 一是纵向比较, 和企业以前年度相比是否在合理范围内变动, 是否出现异常变化; 二是勾稽关系验证, 财务报表科目之间、 报表之间的勾稽关系是否合理可信; 三是场景搭建, 基于违约案例及样本等分析相应财务舞弊手法下财务科目异常场景, 将舞弊信号转变为可量化识别的变量, 制定场景规则模型。具体的识别信号与预警指标情况见表2。
(2) 模型2: 行业偏离识别预警模型。不同行业的业务模式和商业模式存在差异, 相应产业链上的企业则呈现出不同的特征, 这些差异也将体现在财务报表上, 例如制造业与批发零售业、 房地产业与建筑业等的财务科目表现有着天然的差异。因此, 若上市公司经营数据与所处行业特征指标数据存在明显偏离, 则可能是财务舞弊的风险信号。对此, 可从以下两个角度设置相应的识别预警指标输入财务舞弊识别预警模型: 一是趋势偏差, 即公司走势与所处行业走势是否相符, 可结合行业特点提炼行业趋势性及特征性指标, 借助K-Means聚类算法, 构建相似矩阵, 识别预警明显偏离行业趋势的主体; 二是结构偏差, 包括公司特点与所处行业特点是否相符、 公司经营及财务指标等是否符合行业内商业逻辑、 和同行业企业横向对比是否存在较大偏离等。具体的识别信号与预警指标情况见表3。
(3) 模型3: 舞弊压力识别预警模型。上市公司实施财务舞弊往往存在一定的诱发因素、 驱动因素, 即存在财务舞弊压力, 如业绩压力、 资本市场压力、 融资压力等。具体的识别信号与预警指标情况见表4。以资本市场压力中的退市压力为例, 汇聚上市公司财务数据、 交易数据等结构化数据, 借助语义分析模型等提取规范类退市、 重大违法类退市触发信息形成数据输入, 结合退市新规政策提炼各类交易指标、 流动性指标、 波动性指标、 触发性指标等, 借助人工神经网络(ANN)、 支持向量机等模型, 最终量化输出退市风险压力作为财务舞弊识别预警模型输入项。
(4) 模型4: 内部管理识别预警模型。内部管理是指企业内部建立的使各项业务活动互相联系、 互相制约的措施、 方法和规程, 在一定程度上可为财务报告的可靠性、 经营的有效性与真实性等提供保障。内部管理预警更多地聚焦于对上市公司各类异常行为的挖掘, 是对公司内部控制及公司治理生态健康度的识别预警, 需要对非财务税务数据进行挖掘分析。可从公司内部环境是否异常(包括组织架构和人员管理)和公司内部行为是否异常(包括公司行为和交易对象行为)两个方面提炼相应识别预警指标输入财务舞弊识别预警模型。具体的识别信号与预警指标情况见表5。以交易对象行为异常为例, 汇聚工商注册、 司法诉讼、 行业动态、 市场交易等数据以获取更全面的关系信息, 包括投资关系、 上下游关系、 受益人关系、 担保关系、 任职关系等, 借助大数据技术、 图计算等工具构建关联指标, 基于人工智能、 深度学习等技术挖掘更深层次的关联特征和规律, 输出企业知识图谱, 分析财务舞弊风险在企业关系网络中的传导路径, 进而对图谱内的主体异常信号进行识别预警。
(5) 模型5: 外部监督识别预警模型。从外部监督视角来看, 监管单位(包括自律组织)、 司法机关、 审计机构、 资本市场、 媒体等会对上市公司经营管理层面进行监督管理, 促使上市公司不断提升财务报表可信度。基于此, 本文从监管、 司法、 外审、 市场、 舆情雷达等维度设置相应预警指标, 作为财务舞弊识别预警模型的重要输入。具体的识别信号与预警指标情况见表6。以舆情雷达为例, 基于自建、 外部采购方式搜集海量舆情资讯文本, 利用NLP技术进行数据提取和转化, 以人工智能技术为核心, 应用正则表达式、 文本挖掘等大数据挖掘与分析技术以及知识图谱进行新闻舆情监测识别, 再通过深度学习方法进行情感评分, 最终形成舆情风险等级、 热度或分值等。
3. 数智化财务舞弊识别预警体系。财务舞弊识别预警数智化转型意味着活动向信息转化、 信息向数据转化、 数据向模型转化, 而模型可提供智慧分析与决策, 因此本文建议自下而上构建由数据层、 指标层、 模型层、 应用层组成的数智化财务舞弊识别预警体系。
(1) 数据层。汇聚数据并清洗, 搭建数据湖。利用大数据技术搭建数据集中采集平台(简称“数据平台”), 通过ETL(Extract,Transform,Load)工具、 API接口、 网络爬虫等, 汇聚接入上述预警模型中所需的上市公司数据, 包括公司基本信息、 股权结构、 董监高任职、 关联企业、 财务数据、 市场动态、 公告发布、 生产运营、 舆情监测、 监管处罚、 法律诉讼、 市场交易、 行业趋势等多维度信息。接入数据平台后进行一站式采集、 存储、 处理、 分析等, 对于结构化数据采用数据库连接和数据抽取技术进行高效采集, 对于非结构化数据, 运用NLP和OCR技术等将其转换为可分析的结构化数据, 例如词袋模型(BOW)可将文本转换为词频向量、 N-gram模型可捕捉词序列的局部特征、 词频—逆文档频率(TF-IDF)可衡量词语在文本中的重要性。之后, 构建图模型清晰地展示数据之间的关联关系, 如企业之间的股权关系、 交易关系等, 为交易对象行为异常、 组织构架异常等的识别提供数据基础; 使用分布式图计算等大数据技术对这些大规模、 复杂数据集进行并行计算和分布式存储; 使用大数据挖掘与分析技术提取数据特征及关联性等, 按照星型或雪花型模式对数据进行建模和存储。同时, 为确保数据在使用和交换过程中的一致性、 通用性和准确性, 基于统一数据标准, 对汇聚的数据进行统一标签化处理, 使得不同来源、 不同格式的数据能够在统一的框架下进行管理和使用, 最终形成信息全面、 维度丰富、 历史完整、 分类清晰的数据湖, 为建立数智化财务舞弊识别预警体系提供强大的数据基础和保障。
(2) 指标层。从指标范围来看, 结合上文的数智化财务舞弊识别预警模型, 需同步建立包括三大视角(经营活动、内部控制、外部监督)、 十三个维度(财务、税务、生产、趋势偏差、结构偏差、舞弊压力、内部环境、内部行为、监管、司法、外审、市场、舆情雷达)的指标体系。从指标类型来看, 可分为预警指标层和关联指标层。预警指标层是基于数据湖, 通过构建统计模型、 采用文本挖掘和数据分析等方法, 并结合专家意见, 建立财务舞弊识别预警模型指标库, 包括原子指标(不可再拆分的基本指标)、 派生指标(在原子指标基础上增加统计范围,如时间、修饰词)、 复合指标(多个指标组合形成的复合型指标,如同比变化、近三年复合增长)等, 并通过科学的指标“血缘”管理, 确保各指标之间的逻辑关系和数据来源清晰可追溯。以货币资金—存贷双高预警指标为例, 提取数据平台中短期借款、 长期借款、 一年内到期的非流动负债、 货币资金、 利息收入、 利息支出等数据形成原子指标, 加上时间节点形成对应派生指标, 组合计算形成货币资金平均余额、 货币资金收益率、 存贷比、 有息负债利率等复合指标, 并进行相应指标“血缘”管理。关联指标层主要用于挖掘与上市公司主体的关联关系, 以更为全面地识别预警财务舞弊行为。通过关系主体穿透比对、 关系规则对比匹配等技术手段深入挖掘企业间的投资关系、 上下游关系、 担保关系、 受益人关系、 任职关系等, 支持上下穿透多层, 识别隐性关联, 助力识别出那些隐匿在复杂关系网络中的潜在财务舞弊行为。例如, 通过股权穿透核查, 揭示公司背后的实际控制人, 从而发现可能存在的隐性关联和利益输送问题。
需根据指标的区分能力、 稳定性、 缺失率等, 基于科学性、 完整性、 导向性等原则, 选择最终入模的预警指标, 以确保所选指标能够有效识别财务舞弊风险。最终搭建形成多维度、 多层级、 全场景的财务舞弊识别预警指标体系, 该指标体系是智能化财务舞弊识别预警模型的核心输入和有力支撑。基于上述精细化指标体系管理, 需对预警指标进行动态调整和优化, 以提升模型的灵活性和可扩展性, 并依托数字技术对指标数据进行实时监控和动态更新, 以全面捕捉上市公司异常变化。
(3) 模型层。模型层包括数据预处理模型、 特征工程模型、 识别预警模型等。其中, 数据预处理模型包括缺失值处理模型、 异常值监测模型、 数据标准化模型等, 特征工程模型包括特征选择模型、 特征提取模型、 特征组合与转换模型等。本文重点介绍识别预警模型, 这是财务舞弊识别预警的核心。在信息技术不断迭代升级的背景下, 可建立模型实验室, 开发智能化财务舞弊识别预警模型。在上述数据层、 指标层及数智化财务舞弊识别预警框架的基础上, 差异化应用多种先进的机器学习和深度学习方法, 深入挖掘潜藏于数据背后的规律及关系。如: 梯度提升树(GBT)模型、 极端梯度提升(XGBoost)模型能够有效处理大规模数据, 捕捉风险趋势; ANN模型、 卷积神经网络(CNN)模型、 长短期记忆网络(LSTM)模型等能够深度模拟人类大脑神经元工作机制, 剖析数据深层逻辑, 预警异常行为; 知识图谱(KG)模型能够构建企业、 个人、 交易等实体之间的关系图谱, 发现财务舞弊实体之间的潜在关系和风险传导链路, 对数据进行训练。通过混淆举证、 ROC曲线、 AUC值、 KS值等评估方法, 可对模型的性能进行综合评价, 不断优化模型参数和结构, 寻找最优财务舞弊识别预警模型, 持续提升模型的识别准确性和预警效果, 为财务舞弊识别预警提供数智化工具。
(4) 应用层。应用层的构建主要取决于使用者的需求, 如智能监测、 智能预警、 智能分析、 智能决策等。智能监测与智能预警是数智化财务舞弊识别预警体系的核心功能, 通过采用可视化工具实时监测异常变化, 基于智能预警机制自动输出预警提示、 预警等级、 预警画像、 预警报告等, 为决策者提供直观、 全面的预警结果。如: 基于算法引擎、 模型实验室的量化分析结果, 系统化输出上市公司财务舞弊识别预警等级, 再结合专家意见, “人机协同”综合评估其最终等级, 以对财务可信度进行判断; 通过图形化的方式展示企业的财务状况和风险特征, 自动输出详细记录预警事件的背景、 原因及影响的预警报告等。该体系可以对接公司其他计量模型、 管理工具等, 为决策者提供参考, 如: 在尽职调查阶段, 利用预警信息评估目标企业的财务指标可信度, 识别潜在的财务舞弊风险, 为投资决策提供重要参考; 与内部评级系统相结合, 为审查审批、 风险定价等决策提供参考依据; 在投后风险分类、 资产分类中重点考虑财务舞弊识别预警评估结果, 及时调整风险政策和资产配置策略。同时, 该体系可以挖掘常见财务舞弊模式, 进行归类和趋势分析, 如结合聚类分析实现案例智能精准匹配, 不仅提示主体是否存在财务舞弊嫌疑, 而且提示可能采用何种财务舞弊手法, 为审计人员和监管机构提供线索和方向; 还可以结合人工分析判断以及日常监测预警情况, 反向优化财务舞弊识别预警模型, 确保模型在实际应用中不断改进和完善, 形成一个持续迭代、 自我优化的良性循环。
六、 总结
随着技术的发展和内外部环境的变化, 财务舞弊手段不断演进升级, 给市场监管、 投资者保护、 企业治理等均带来了巨大挑战。财务舞弊行为不仅会阻碍上市公司自身的可持续发展, 还会扰乱资本市场秩序、 动摇投资者信心, 对资本市场整体高质量发展造成严重的负面影响。本文从三大视角构建了数智化财务舞弊识别预警框架, 并结合专家经验及财务舞弊场景, 针对各维度示例预警信号及预警指标, 构建了数智化财务舞弊识别预警体系, 形成财务舞弊识别预警数智化转型路径。大数据分析、 智能算法等的应用能够助力提升财务舞弊识别预警精准度, 实时、 多维、 全方位、 智能化的监测与识别预警能够助力提升财务舞弊识别预警有效性, 基于数据驱动、 机器学习等的动态监测及调整能够助力提升财务舞弊识别预警前瞻性。财务舞弊识别预警数智化转型有助于从质量和效率上提升财务舞弊识别预警水平, 助力我国资本市场在高质量发展的道路上行稳致远。
【 主 要 参 考 文 献 】
洪文洲,王旭霞,冯海旗.基于Logistic回归模型的上市公司财务报告舞弊识别研究[ J].中国管理科学,2014(S1):351 ~ 356.
黄世忠,黄京菁.财务报表舞弊行为特征及预警信号综述[ J].财会通讯,2004(23):4 ~ 9.
姜富伟,丁慧,靳馥境.参照点效应、公司治理与上市公司财务重述[ J].经济研究,2023(10):191 ~ 208.
李清,任朝阳.上市公司会计舞弊风险指数构建及预警研究[ J].西安交通大学学报(社会科学版),2016(1):36 ~ 44.
郦金梁,吴谣,雷曜等.有效预警上市公司违规的递延所得税异动指标和人工智能模型[ J].金融研究,2020(8):149 ~ 168.
刘云菁,伍彬,张敏.上市公司财务舞弊识别模型设计及其应用研究——基于新兴机器学习算法[ J].数量经济技术经济研究,2022(7):152 ~ 175.
钱苹,罗玫.中国上市公司财务造假预测模型[ J].会计研究,2015(7):18 ~ 25+96.
王杏芬,张彧.新舞弊风险因子理论下首例违法退市案研究[ J].会计之友,2020(22):46 ~ 52.
叶钦华,黄世忠.财务舞弊的新特征与新应对——基于专网通信舞弊样本[ J].财会月刊,2024(19):3 ~ 8.
叶钦华,叶凡,黄世忠.财务舞弊识别框架构建——基于会计信息系统论及大数据视角[ J].会计研究,2022(3):3 ~ 16.
张学勇,施懿.基于元学习的财务舞弊识别研究[ J].管理科学学报,2023(10):95 ~ 113.
Brown N. C., Crowley R. M., Elliott W. B.. What Are You Saying? Using Topic to Detect Financial Misreporting[ J]. Journal of Accounting Research, 2020(1):237 ~ 291.
Fanning K. M., Cogger K. O.. Neural Network Detection of Management Fraud Using Published Financial Data[ J]. Intelligent Systems in Accounting Finance amp; Management,2015(1):21 ~ 41.