在内部审计中,我们很少有条件去全查,更多时候要依赖抽样。抽样看似技术性强,但其背后体现的是 职业判断、风险意识与效率权衡。第2108号准则就是要把抽样这件事做规范:怎么抽、抽多少、怎么看结果、怎么防止误判。
01 什么是审计抽样?
准则第二条给出的定义:
审计抽样就是从总体中抽取有代表性的样本,基于样本结果去推断总体特征,从而形成审计结论。
这里有三个关键词:
总体:比如所有销售发票、所有采购合同。 样本:从总体中抽出来的一部分。 推断:用样本结果代表总体情况。
抽样的本质是:用有限的审查,支撑整体性的判断。这既是效率的需要,也是风险控制的要求。
02 抽样的基本原则 准则提出了三个原则(第五条):
相关性:样本必须与审计目标直接相关。比如审计采购合规性,样本应来自采购合同,而不是随机选财务凭证。
充分性:样本数量要足够,能代表总体情况。样本太少,风险结论就站不住。 经济性:考虑成本效益。不能无限扩大样本,否则失去抽样的意义。
在实务中,很多内审人员容易重数量轻质量,以为多抽样就更安全。但如果样本不相关、不典型,再多也无意义。
03 抽样方法:统计 vs 非统计
第六、十三条明确:审计抽样既可以用统计方法,也可以用非统计方法,两者结合效果更佳。
统计抽样:基于数学原理,按随机原则选样,结论更具可量化性。包括:属性抽样(发现抽样、连续抽样) → 判断是否存在错误;变量抽样(单位均值、差异估计、货币单位抽样) → 估计误差金额。
非统计抽样:依靠审计人员的专业判断和经验,例如针对高风险交易选样。
实务启示:
在对外部利益相关者负责的审计(如财务报表内审)中,更适合用统计抽样。在管理改进类项目中,非统计抽样更灵活,比如重点挑选高金额、异常频繁的合同。
04 样本量的确定:影响因素
第十四条列出了五个要素:
总体规模:总体越大,样本量越多。
可容忍误差:可接受偏差越小,需要的样本越多。 预计总体误差:预计问题多,就要多抽。 抽样风险:风险越高,就要增加样本量。 可靠程度:希望结论越可靠,就要更大样本量。
举个例子:
如果审计目标是判断 10,000 笔交易是否存在舞弊,且管理层要求 95%置信度,那样本量就必须显著增加;如果只是内部流程合规性测试,可容忍误差设得高一些,样本量就可以减少。
05 样本选择方法
第十五条提到五种常用方式:
随机数表选样法(完全随机);
系统选样法(按固定间隔抽取); 分层选样法(按金额大小或风险分层,再抽样); 整群选样法(以群组为单位); 任意选样法(依靠职业判断)。
在实务中,常用的是 系统抽样 + 分层抽样。例如:按时间顺序每隔 50 笔抽一笔,同时单独抽取金额前 10 大的合同。这样既保证代表性,又覆盖重点。
06 风险与误差:抽样的陷阱
第十九、二十条特别强调了风险:
抽样风险:
误受风险:样本显示没问题,但总体其实有大问题 → 最危险。
误拒风险:样本显示有问题,但总体其实没问题 → 浪费资源。 非抽样风险:不是抽样导致的,而是人或程序的问题,比如:抽错总体;程序执行不当;样本结果解释错误;审计人员能力不足。
这提醒我们:抽样不是万能的,质量取决于方法和执行。
07 抽样结果的评价与应用
第九、十七至二十三条强调:抽样结果要 定量+定性结合。
定量:计算样本误差,推断总体误差,与可容忍误差比较。
定性:考虑误差的性质和原因,例如:是偶发错误还是系统性缺陷?问题是否可能影响其他业务?
如果推断总体误差超过可容忍水平,内审要么 增加样本量,要么 使用替代程序(如全查高风险项目)。
实务启示:不要机械化地算数字,而是结合业务实质来判断。例如:即便总体误差未超阈值,但发现的错误涉及舞弊,仍需高度重视。
08 抽样是科学与判断的结合
《第2108号内部审计具体准则——审计抽样》明确了:抽样的目标是 在有限成本下获得合理保证;方法既有统计性,也有判断性,需灵活结合;结果评价不能只依赖公式,还要考虑业务风险。
在实务中,抽样最大的价值在于 平衡效率与保证水平。审计人员既要掌握统计原理,又要有足够的业务理解和职业判断力,才能真正用样本代表总体,用有限的证据支撑合理的结论。