摘 要:在信息技术飞速发展的当下,大数据技术成为推动各行业创新变革的关键力量,在工程审计领域变革尤为显著。传统工程审计受人力和分析手段限制,难以满足需求。大数据技术赋予审计人员强大的数据处理与分析能力,让审计更高效、准确、全面。本文深入探究其在工程审计实践中的应用,剖析优势、实际应用、面临挑战及应对策略,期望助力工程审计未来更好发展。
关键词:大数据技术;工程审计;数据分析
一、引言
在信息化、数据化浪潮下,大数据技术给各行各业带来机遇与挑战。工程领域作为数据密集型行业,在信息化和工业化推动下,数据量呈爆发式增长,致使工程审计面临数据处理难度提高等难题。传统工程审计依赖人工处理大量数据,效率低、易出错,难以满足需求。大数据技术凭借强大的数据处理与分析能力以及实时性,为工程审计提供新方案。运用该技术,审计人员能高效处理海量工程数据,挖掘潜在问题与风险,提升审计准确性和深度,还能实时监测工程施工,降低风险。当下,因大数据技术可优化审计流程、提高效率和质量,越来越多审计机构和人员开始学习运用。但也要正视其在工程审计应用中面临的数据安全、技术更新、人才培养等挑战。本文将深入探讨大数据技术在工程审计实践中的应用,为该领域发展提供参考。
二、大数据技术在工程审计中的优势
(一)提高审计效率
传统工程审计方法常常需要投入大量人力和时间,用于逐一核对与分析海量数据。其中,抽样审计作为传统审计常用方法之一,虽有其优势,但因抽样方法的局限性,在测试工作和细节分析时总会面临无法完全避免的风险。这种风险可能导致审计师做出错误的审计判断,进而影响审计的效率和准确性。然而,大数据技术的应用使审计人员能够快速处理全部数据,即便面对数据异构的特点,也能通过人工智能相关算法进行分类处理。这种能力使审计人员能够迅速筛选、整理和分析工程项目数据,从而大幅提高审计效率。此外,大数据技术还能对实时数据进行监控和分析,帮助审计人员及时发现潜在风险和问题,进一步提升审计效率。
(二)增强审计准确性
工程审计的准确性直接关系到工程项目的质量、透明度和公信力,以及企业的经济效益。大数据技术在工程审计中的应用,不仅能提高审计的准确性,降低误判和漏判的风险,还能帮助审计人员更全面地了解工程项目的实际情况。例如,审计人员利用数据挖掘技术深入分析工程项目数据,识别出数据中的异常值、趋势和模式,从而发现潜在风险点或违规行为迹象。此外,工程项目的各个环节往往相互关联,一个环节的问题可能影响其他环节的正常运行。审计人员可利用关联分析技术,揭示数据之间的内在联系和相互影响,了解它们对项目整体的影响,从而更全面地评估项目的风险和效益。
(三)拓展审计范围
传统工程审计往往局限于对工程项目本身的审查,而忽视了对项目相关的外部环境、市场环境等信息的考量。大数据技术的应用使审计人员能够分析海量数据之间的关联关系,构建关联网络,从而发现被审计单位内部或外部利益相关者之间的关联关系,以及这些关联关系对审计的影响。这不仅能对工程项目本身进行审计,还能对项目相关的外部环境、市场环境等信息进行综合考虑,进而拓展审计的范围和深度。
(四)实现预测性审计
大数据技术不仅能处理和分析历史数据,还能利用人工智能等方法对未来趋势进行预测。在工程审计中,收集并整理以往实践案例中的大量数据和信息,利用大数据技术对这些数据进行清洗整合,寻找其中的规律并建立预测模型,根据建立的模型对当前工程项目中的数据进行分析预测,实现对工程项目的预测性审计。审计人员通过预测性审计可预测出未来可能出现的风险和问题,并提前给出建议和制定相应的应对措施。这有助于企业提前规避风险,保障工程项目的顺利进行。
三、大数据技术在工程审计中的实践应用
大数据审计技术给工程审计领域带来了巨大机遇,以下是两个大数据技术在工程审计不同领域应用的详细探讨。
(一)聚类算法在工程审计中的应用
鉴于传统审计模式在应对企业固有风险因素和内部控制风险方面存在局限性,现代审计实践逐渐倾向于采用风险导向审计模式,以更有效地识别、评估和管理潜在的审计风险。在风险导向审计模式下,审计人员需要具备合理的职业怀疑能力,充分考虑被审计单位的环境,系统地识别和考虑存在的审计风险。随着互联网的普及,数据量日益增多,审计人员进行审计时也需面对更多数据。按照传统审计抽样的要求,从审计数据中选取样本不仅需要花费大量人力与资金,还不一定能找到相关审计疑点,保证审计质量。鉴于此,与审计工作契合度更高、不需构建训练集模型的聚类方法便能很好地解决这些问题。
聚类算法是将数据集中的样本进行划分,把具有相同特性的数据归在一起,不同特性的数据分开,通常根据不同规则划分为若干个通常不相交的子集,每个子集称为一个“簇”(cluster)。通过这样的划分,每个簇可能对应一些潜在的概念或类别。由于规则不同,聚类的方法也有很多。如图1所示。

K-Means算法(k均值聚类算法)于1967年由JMacQueen提出,是知名度最高的聚类算法之一,属于常用的基于欧式距离的无监督学习算法。其原理是,K代表要聚的类个数,Means是各点与簇中心点距离的平均值,通过计算与中心点的距离确定归为哪一类。该算法稳定性高、聚类效果出色,能消除数据输入顺序对结果的影响,无论数据输入顺序如何,都能得到相同聚类结果,极大简化了数据预处理,是处理复杂工程项目和商业审计数据的高效选择。
在工程审计中,对工程项目数据进行聚类分析,能发现与大部分数据点差异显著的异常点,这些点可能反映异常交易、成本支出等,需审计人员重点关注。进行项目工程审计时,为精准分析购入货物数据,可运用K-Means聚类算法对预处理后的数据分类。利用matplotlib库生成散点图,能直观展示聚类结果,每个点代表某日期购入货物的数量与金额合计。观察散点分布,审计人员可快速掌握数据特征。当散点图出现密集区域且能连成固定斜率线,意味着购入商品单价稳定;而自成一类的散点,往往对应虚假购入信息。借助聚类算法,审计人员能快速发现异常点,进而分析发现问题。
(二)图像识别技术在工程审计中的应用
工程项目中,围标串标行为屡见不鲜,这些违法招投标行为严重破坏市场公平竞争环境,影响工程质量和效率。在传统工程审计中,审计人员需手动审查大量招标文件、投标文件、合同等纸质或电子文档,以查找围标串标迹象。但随着工业化和电子信息的发展,审计人员面临海量数据和图像信息,传统审计方法耗时且易出错。鉴于此,大数据技术可用于审计围标串标行为,图像识别技术便是其中之一。图像识别技术属于深度学习,将图像文字转化为计算机程序数据后进行分析处理。借助Python软件中的OpenCV库(跨平台计算机视觉库)和NumPy库(开源数值计算扩展),能实现图像识别。其具体步骤为,先预处理并提取图像特征,如采用SIFT(尺度不变特征转换)算法。SIFT算法的特征匹配分两个阶段,一是提取图像特征,得到尺度不变的特征向量;二是特征匹配,通过关键点特征向量的欧式距离确定两张图像相似度。从一张图片选关键点,在另一张找两个最近关键点,若最近距离与次近距离比值不超临界值,则匹配正确。之后利用OpenCV库函数计算图像相似度,简单算法如余弦相似度,意思是对每张图计算所选特征,得到特征向量,使用余弦相似度计算两个特征向量之间的相似度,即是用两个向量的点积除以两个向量长度(向量模)。最后设定余弦相似度阈值判断图片是否相似,阈值需根据实际情况调整。在检查工程项目围标串标时,图像识别技术并非主要手段,因为围标串标主要涉及文本信息分析。但在某些间接或辅助方面,它仍有积极作用。例如,招投标过程中的投标文件封面、印章、签名等图像资料,若不同标书间存在高度相似图片,就可能暗示存在围标串标行为,需引起警惕。
四、大数据背景下工程审计面临的挑战和对策
(一)数据整合与管理
工程项目中涉及的数据量庞大,包括工程实施过程中产生的各类工程数据、人员流动数据、设备数据等,这就需要建立一个统一的数据整合平台,将所有的数据在一个平台中进行流通。同时,工程项目中的数据类型繁多、来源复杂,包括结构化数据、半结构化数据和非结构化数据,还涉及图像、文档、视频等多媒体数据。这些对审计的数据分析和处理能力提出了更高的要求,因此,还需要建立一个具有统一的标准体系的数据管理体系。
(二)技术和人才短缺
大数据审计需要跨学科的专业知识,包括数据分析、信息技术及工程管理,但目前相关专业人才较为稀缺。为了解决这个问题,我们可以加强审计人才队伍的建设。可以从大学就培养相关人才,比如开设大数据相关课程,更新相关教材。还可以通过引进和培养具有信息技术背景的专业人才,拓展审计人才队伍的构成,提高审计团队的整体素质和能力水平。但需要注意的是,在推动大数据技术的实践中,我们不仅要致力于普及审计人员对相关知识的学习与理解,更需注重在数量增长的基础上,着力提升该领域人才的培养质量。
(三)数据安全问题
随着互联网发展,大数据技术给通信、生活和工作带来便利,但数据安全问题也随之而来。计算机病毒、蠕虫、黑客攻击等客观因素,以及数据泄露等主观因素,都威胁着数据安全。为解决这些问题,国家应完善相关法律法规,加大对违法行为的惩处力度,如罚款、没收违法所得、吊销营业执照等。同时,还需建立健全数据安全与隐私保护机制,采用先进加密算法和技术手段,对敏感数据加密存储和传输。
五、结束语
大数据技术的应用为工程审计带来了前所未有的机遇和挑战。工程审计领域的审计人员通过使用大数据技术,可以提高审计效率、增强审计准确性、拓展审计范围。然而,事物都是有两面性的,大数据技术带来机遇的同时也带来了挑战,为了应对这些挑战,我们需要加强技术创新和人才培养工作,同时加强数据安全和隐私保护工作。只有这样,我们才能更好地利用大数据技术推动工程审计事业的发展。
(文 / 毛琳)
(作者简介:毛琳,南京审计大学,硕士在读。研究方向:审计)
参考文献
[1]钟飚,左丹,李东辉,冯守印.大数据环境下数字化技术在政府投资项目审计中的应用[J].审计与理财,2022(08):21-22.
[2]常远,康娜娜.K-means聚类在审计疑点发现中的应用探索[J].中国注册会计师,2018(05):84-86.
[3]华玉雯.大数据下围标串标现象识别研究[D].山东建筑大学,2023.
[4]梁伟.构建大数据分析模型助力公安采购项目审计监督[J].中国内部审计,2023(09):44-49.
[5]罗方园.浅谈大数据背景下工程审计的现状和建议[J].河北企业,2023(12):33-35.
- 本文固定链接: http://www.dlqsyzz.com/10144.html
- 转载请注明: 《大陆桥视野》 于 大陆桥视野 发表