编辑加工过程中数据问题的解决之道

王雪飞

图书中数据应用可以展示统计信息、为论点提供数据证据，进一步支持论点。现对图书编辑出版过程中常见的数据错误进行梳理和分析，并总结出七类错误，包括引用类错误、数据前后不一致、计算类错误、因刻板印象忽视的错误、“搜索引擎不一定对”的错误、年代类错误和序号类错误。希望借此为编辑工作者提供有益的参考，为数据处理提供实用指南。

背景

数据被定义为信息的表现形式和载体，包括符号、文字、数字、语音、图像、视频等。当前，我们正处于一个数据引领信息、推动知识和思想更新的时代，数据已成为新的生产要素。数据本身不具备实际意义，只有当数据影响行为时，它才会被转化为信息，具备实际意义和价值。然而，一旦数据本身存在错误，信息的真实性也会受到威胁，并导致决策的失误。

很多图书都包含数据信息。图书中应用数据可以展示统计信息、为论点提供数据证据，进一步支持论点。因此，数据的准确性对图书的可信度和内容的质量至关重要。

首先，对读者来说，图书被视为可靠的参考来源，以获取知识和信息。只有内容可信，才能帮助读者建立正确的认知体系。如果书中包含错误的数据或论述，读者可能会产生错误的观点。因此，图书内容的准确性对读者的学习、研究和个人发展至关重要。

其次，真实性是学术诚信和学术道德的基石。学术界的作者有责任确保他们著作中内容的准确性，以免误导读者、破坏自身在学术领域的声誉。通过深入研究和严格验证以确保图书内容的准确性，维护学术诚信和学术道德。

最后，对社会来说，图书对社会观念的塑造和行为准则的树立具有重要影响。信息准确的图书有助于帮助大众形成正确的社会观念和行为准则，推动社会发展和进步。相反，错误的信息可能导致误解、偏见和错误的行为。

图书作为传播知识的主要媒介，其准确性至关重要。准确性不仅是对图书内容的要求，也是对知识传播的道德与伦理规范的维护。一本书的内容应该是经过深思熟虑和权威验证的，确保其中的信息是准确、可靠、可信的。如果一本书包含错误数据，一旦出版并传播出去，将对知识的传播产生负面影响。

错误数据的危害

首先，错误的信息会误导读者，让他们在学习和研究过程中“误入歧途”。这不仅会浪费读者的时间和精力，还可能导致读者形成错误的理解，甚至在将来的学习和工作中犯下严重错误。其次，错误的信息还会降低读者对图书和其他出版物的信任程度。这会对整个出版业的公信力构成威胁，使人们对图书内容持怀疑态度，影响知识的广泛传播。

从更广泛的角度来看，错误数据的传播可能会影响整个社会的知识结构和发展。如果大量的错误信息被广泛传播，读者可能会形成偏见和误解。这可能对政治、文化领域产生严重的负面影响，影响社会和谐与进步。

编辑的作用

编辑作为图书的把关者，要时刻保持警惕。编辑的任务不仅是审校错字别字、语法和格式，还包括确保书稿内容的真实性和数据的准确性，对事实准确性、可信性和数据真实性进行深入审查，站在对作者和读者负责的角度，以极高的责任心来履行职责。这不仅是编辑职业要求的一部分，也是尊重读者的体现。

错误数据分类及解决对策

引用数据错误

这类错误是指由于粗心引用他处数据时产生的错误。这类错误有时比较明显、有时比较隐蔽，可能会在图书编辑和校对过程中被检测出来，但如果作者和编辑均缺乏数据敏感性，这类错误可能会被呈现到作者面前，对知识的准确传递构成威胁。

例1：随着我国经济的发展，居民人均可支配收入逐年上涨，2022年我国居民人均可支配收入为36883万元。

分析：居民人均可支配收入为36883万元，这一数额巨大，严重脱离实际。查阅相关数据可知，2022年全国居民人均可支配收入为36883元。书稿中多了一个“万”字。

例2：2022年，全国居民人均可支配收入中位数31370元，城镇居民人均可支配收入20133元，农村居民人均可支配收入49283元。

分析：通常情况下，城镇居民的人均可支配收入要高于农村居民的人均可支配收入，但这句话中的农村居民人均可支配收入远高于城镇居民人均可支配收入，不符合常理，经查证可知这两处数据引用错误。

为避免出现这种类型的错误，编辑应该仔细审查和校对文本，特别是对数字和专业术语保持敏感，联系上下文，避免出现不符合常规的情况。

数据前后不一致

这类错误是指同一部书稿中出现了自相矛盾的数据，即同一个事物有两个甚至两个以上的不同数据，容易产生混淆。

例3：某书稿第28页提到：

刚果（金）已探明的石油海上储量3151万桶，陆地储量2000万桶。

但在第33页却有另一种说法：2020年底，刚果（金）已探明的石油海上储量为2.9亿桶，储产比达到25.7%。

分析：经与作者核实，并查阅刚果（金）投资促进部门网站上公布的《2023年刚果（金）年鉴经济报告》，第2处数据为错误数据。

当书稿中涉及相同事物，尤其涉及相关数据的表述时，编辑应谨慎对待，以确保数据的一致性。如果发现前后不一致的数据，应多加留意，主动与作者沟通，提出核对要求，对于公开的数据，编辑可选择可信的权威来源自行查阅，并进行验证。

计算类数据

很多数据可能存在密切的联系，这种联系可能是基于复杂的计算、统计或数学模型。为确保数据的准确性和可信度，编辑必须深入理解这些数据之间的计算关系，并通过适当的计算和核证来验证其一致性。

例4：经监督总公司签署后的DPI预报单一式七联，其中向中央银行和海关分别寄送一份和三份（分批交货也是如此）、进口商留存二份。

分析：1+3+2=6，与一式“七”联有冲突之处。经核实，该资料为商务部2002年发布，原文就存在数字错误，且资料过于陈旧，因此，在与作者沟通后，替换为其他内容。

当然，若是数据存在较少的误差，比如误差在0.1%左右，也可能是正确的数据，因为这两个数据可能是四舍五入前后计算出的，存在误差是可以接受的。

例5：截至2021年12月末，辖内金融机构各项存款余额697亿元，比年初增加57亿元，增幅108%。

分析：增幅被用于衡量增长量相对于原始量的比例。57明显小于697，但是增幅却达到了108%，这显然不合理。经计算得知，增幅应为8%。错误的原因在于撰稿人对“增幅”的理解有误。

对于这类有关联的数据，在编辑过程中，只需拿起计算器进行核实，就能发现问题所在。当然，前提是编辑要对各类数据之间的关系做到心中有数。这对核实数据之间的计算关系，确保数据的准确性、可信度和可重复性至关重要。

因刻板印象忽视的错误数据

还有一种是明显的错误数据，由于刻板印象缺乏对错误的查证。例如，作者可能在书稿中引用了一个众人熟悉、看似可信的数据或事实，但这个数据或事实未经充分的验证或查证，因为这个数据或事实符合他们的先入之见。

例6：世界银行在2019年将塞内加尔重新归类为中低收入国家，2022年，塞内加尔人均国内生产总值为1.597美元。

分析：在很多人的印象中，非洲可能是比较贫穷的地方，且文中提到塞内加尔为中低收入国家。所以，编辑看到较低的国内人均生产总值，会误以为这是真实情况，从而忽略查证，放过这个错得离谱的数据。如果提高警惕，避免受刻板印象影响，就能够觉察到这一异常，再找到权威来源，就很容易改正，塞内加尔的人均国内生产总值为1598.7美元。

为避免刻板印象导致的数据错误，编辑应该始终采用客观、以事实为基础的准则，对信息进行充分核实。不依赖主观印象，而是以事实为依据，确保信息的准确性和客观性。

“搜索引擎也不一定对”的数据

有一种错误数据，因为“以讹传讹”，扩大了错误数据的传播范围。所以，编辑通过互联网查询这个数据，能在网上找到很多佐证这个数据的文章。如果编辑相信了互联网上的内容，那么就可能造成错误数据继续误传。

例7：长沙是唯一一座3000年不改名的城市。

分析：即使第一感觉不对，为了验证这句话，把这句话输入电脑进行搜索，会看到“一个历经三千年城名、城址不变的国家历史文化名城：长沙”“我国从未改名的城市，名字用了3100多年，中国历史上绝无仅有”“长沙，中国史上唯一经历三千年历史城址不变的城市”等标题。如果轻易相信这些标题，势必会放过眼皮底下的错误。实际上，作为一个拥有5000年历史的国家，我国有不少城市的名字一直沿用至今，3000年不改名的城市，还有成都、邯郸等。在看到一些句子中有“唯一”“最”“第一”等字眼时，不仅要小心查证，还要选择权威来源，不能仅依靠网络上一些传播较广的文章就听之信之，否则可能会把错误留在书上并传播开去。

例8：文莱是世界第四大天然气出口国。

分析：首先，在读者日常的印象中，常见的天然气出口大国有美国、俄罗斯、加拿大等读者熟悉的国家，但对文莱缺少印象。以“文莱天然气出口”为关键词，在网络上进行搜索，会看到很多包含此类词汇的文章。例如，名为“飞哥聊科学”的自媒体发表了一篇文章《国土面积比上海还小，森林覆盖率世界第一，文莱为何富得流油？》；中南经济网等网站也有类似信息，“文莱是东南亚第三大产油国、世界第四大液化天然气生产国”。但是，查找一些权威机构去核实数据后得出的结论是：文莱曾是世界第四大天然气生产国，所以，通过查证，这则信息是正确的。

错误信息的源头可能在最初的出处，一旦数据源头出现错误，后续引用它的文章也会出现相同的错误。在互联网时代，信息传播速度非常快，错误信息可能会瞬间传遍网络。一旦某篇文章被广泛传播，其他人可能会直接引用，而不加以验证，导致错误信息被继续传播。但谨慎的验证可以减少这种错误。更重要的是要始终保持批判性思维，并对信息的准确性保持警惕。

面对数据时，编辑应该寻找其他权威来源，或向学术研究人员请教，以核实这些数据，或至少确认它们处于主题的“合理范围”内。

年代类数据

例9：唐大历四年（679年）析固安县地置新昌县。

分析：历史纪年所对应的公历年份在书稿中出现的错误率非常高。《现代汉语词典》的附录部分载有“我国历代纪元表”。通过此表，可以对历史纪年进行核实。也可通过可靠的网络软件搜索，经查验，唐大力四年应为769年，非679年。

在看到古代纪年和公元年号时，编辑最好能够多做一步，进行核对，以便发现其中的错误。

序号类数据

由于图书内容较多，图书常被划分为很多章节，部分图书还涉及图表和图表各自的编号。同时，编辑在加工修改的过程中，可能对章节内容、图表顺序进行增删调改。这些都可能造成章节序号、图表序号的混乱。正确的做法是，编辑在加工过程中兼顾对这些内容的修改，待图书三审三校，并确认没有较大修改后，集中精力，逐一核对各章节的图序号、表序号等，最大限度地避免遗漏错误。

在当今信息爆炸的时代，每个人都面对着大量的信息和数据，且数据量还在不断增加。虽然，这为读者获取数据提供了便利。然而，随之而来的是数据中可能存在的错误。若不对此加以辨别，读者容易被错误数据误导。因此，编辑需要谨慎地处理信息和数据，确保数据的准确性和可信度。

首先，追求数据的可信度，有意识地判断数据来源的可靠性。其次，在编辑加工过程中，有意识地记忆数据。通过记忆重要数据，可以更容易地发现错误，特别是一些前后矛盾的错误数据。最后，当遇到新的数据时，迅速评估其合理性，与已知的事实和数据进行对比，通过相互验证保证信息的准确性。

图书是信息传播的媒介。所以，编辑的责任不仅是编辑文字，还在于对图书质量的把关，特别是对数据的把关至关重要。因此，在审校数据相关内容时，编辑必须保持高度责任感，牢记自己的责任。编辑须以读者为中心，保护读者的权益，避免向读者传递错误或不准确的数据。编辑的工作直会接影响读者对图书的信任程度，因此，编辑应及时处理和纠正各种数据错误，为读者提供可信的信息和知识。

（作者单位：中国市场出版社）

最近发表

标签列表

编辑加工过程中数据问题的解决之道

相关阅读

大数据时代下高校图书馆助推大学生数据素养教育

高校图书馆知识管理平台构建及运行机制

科普类MG动画中的数据可视化研究

数据的经济增长效应：基于广义内生增长模型的分析

最近发表

标签列表