大数据时代基于孤立点分析的审计抽样方法

大数据时代基于孤立点分析的审计抽样方法探讨[摘要]在计算机技术发展过程中,海量的存储及高效的计算机运算为实际工作提供了较强的技术支持。审计工作需要处理和分析海量的财务数据,利用计算机数据挖掘技术开展审计工作,能突破传统方法的限制,并且提升工作效率。通过应用计算机数据挖掘技术的孤立点分析,构建相应的模型,能有效发现审计中的问题,对审计工作的顺利开展具有重要意义。本文采集自网络,本站发布的论文均是优质论文,供学习和研宂使用,文中立场与本网站无关,版权和著作权归原作者所有,如有不愿意被转载的情况,请通知我们删除已转载的信息,如果需要分享,请保留本段说明。[关键词]孤立点分析;审计抽样;大数据doi:10.3969/j.issn.1673-0194.2017.12.022[中图分类号]F239.2;TP311.13[文献标识码]A[文章编号]1673-0194(2017)12-00-02在当前时代背景下,有效开展审计工作成为各行业发展的关键。通过实践,相关技术研究人员发现应用数据挖掘技术的孤立点分析,可以极大提升数据分析能力,辅助审计工作中的专业判断,并发现隐含问题,为审计工作提供必要的支持。1孤立点概述所谓孤立点,指的是在运用计算机处理数据的过程中,出现的处于离散状态的小规模数据对象,这一小部分数据对象与数据中的一般规律和趋势具有显著差异。在海量数据中,往往会出现一些与众不同的数据,这些数据并不是由随机偏差产生的,可能产生于完全不同的机制,所以在聚类分析中表现为不属于任何的簇或者类,这些数据对象一般被叫做噪声,在相应的孤立点分析中叫做孤立点。在审计领域,因为具体的模型和审查背景存在一定差异,所以对于孤立点的分析也会得出不同的结论。此外,蓄意操作、操作错误、整体数据偏差、系统和测量错误等都会导致孤立点的出现。因此,相关审计人员需要关注这些因素,并对深入分析相关情况产生的原因,从中筛选出价值较高的信息内容。2孤立点分析孤立点分析,指的是利用数据分析方法和挖掘理论模型,发现数据在集中态势下出现的异常值。在审计分析过程中,异常的频率、事件和数据往往具有特殊的含义,且包含着重要信息,可以从中发现违规、违法行为的线索。2.1孤立点分析的步骤孤立点分析方法大致包括两个步骤。第一步:确定数据集合中变量的属性,而后根据非财务数据和财务数据进行分类。接下来进行因子分析,从多个变量指标中选出具有一定代表性的综合变量指标,而后达到数据降维的目的,是重要的多元统计方法。在分析过程中,使用解释总方差可得到累计方差贡献率,该指标的高低直接影响原始数据代表程度的高低,若影响程度较高,则相应的公共因子可信度就较高。计算输出因子的荷载矩阵,能获得原始数据的系数矩阵,相应的元素数据如果较高,那实际原始数据的解释程度就比较理想,有利于对相应公共因子命名,并能获得预期的数据指标。第二步:挖掘和检测数据,如果数据中呈现出离散状态的小规模数据,那么能发现孤立点。传统方法主要应用密度、偏差、距离的特定方法来寻找相应的孤立点。此外,使用云计算技术,能应用比较复杂的运算方式来计算相应的计算资源。2.2孤立点分析的方法第一,基于人工神经网络模型的方法。在这种方法中,可以使用比较小的统计数据集,同时也可以采用比较大的专业数据集,所以检测大小数据孤立点都能获得良好的效果。但是,这种方式在检测具有放射状孤立点数据集时,实际效果不佳。第二,基于偏离的分析方法。这种方式是根据数据对象的突出特征来进行分析和检查,并找出其中的孤立点。在这种分析模式下,一般采用OLAP数据立方体技术及序列异常技术。前者需要把审计中的异常单元进行正确标注并且下钻,这样可以发现更深层次的问题。后者需耍预先定义样本集中的一般特征,并且把相应的偏离和具备这些特征的样本区别开来,可以通过相关审计数据集的总方差来发现相异度函数第三,基于距离的分析方法。这种方法主要对相关数据域的数据内容进行相异度分析,并且清洗相应的审计数据,检验数据的有效性后,再根据相关审计内容特征,通过公式计算出符合大部分对象之间距离的相应阈值,同时把相应数据定义为孤立点。通过这种方法,可以...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?