HUASHI3483 发表于 2003-12-19 22:52:53

稽查选案系统数学模型简介 [转帖]

稽查选案系统数学模型简介   

                                                高勇   耿新伟   

   如何有效利用计算机技术,深层次地挖掘基础数据进行稽查选案,为稽查部门提供高水平、高准确率的案源,是当前征管系统软件开发中的难点之一。

   一、稽查选案系统中重要控制参数的定义及其作用

   在一个智能系统中,必然存在一些控制参数,用来控制系统的内部运行状态,以达到自动控制的目的。在稽查选案系统中也同样存在这样一些重要的控制参数,来保障稽查选案系统的稳定性、准确性和有效性。下面将具体介绍稽查选案系统中主要的控制参数及其作用。

    ( 一 ) 输出选案户数

   该参数定义了稽查选案系统中最大的输出户数,用来有效地控制选案率,使系统输出指定数量的、最有可能进行偷逃税款的纳税人。

    ( 二 ) 加权点数

   该参数定义了在稽查选案系统中某一选案指标反映问题的准确性及对选案准确率的贡献程度。

    ( 三 ) 偏差率

   该参数定义了在稽查选案系统中某一稽查问题发生的严重程度。该参数用来建立统一的衡量各种财务指标波动异常程度的度量标准,并且该参数屏蔽了不同财务指标内涵间的个性,提取其共性,为建立统一模式下的稽查选案系统打下了基础。

    ( 四 ) 综合点数

   该参数来源于加权点数乘以偏差率,主要用于反映稽查问题的严重程度及对选案准确率的贡献程度。

    ( 五 ) 累计加权点数

   该参数定义了在稽查选案系统中某一纳税人发生的所有稽查问题加权点数的总和。该参数反映了纳税人存在问题的严重程度,也反映了其偷逃税款的可能性。

    ( 六 ) 累计综合点数

   该参数定义了在稽查选案系统中某一纳税人发生的所有稽查问题综合点数的总和。该参数反映了纳税人财务指标整体异常的严重程度及对选案准确率的贡献程度。

    ( 七 ) 选案问题数

   该参数定义了在稽查选案系统中某一纳税人发生的所有选案问题数量的总和。主要用于反映纳税人存在问题的多少及整体严重程度。

   二、稽查选案系统的整体模型及其功能描述

   一个智能的稽查选案系统应该由计算机一次选案、计算机二次选案、人机结合选案、立案、稽查信息反馈、选案指标加权点数的自动修订 6 个部分组成,各个部分相互配合、相互影响,从而建立起一套高智能化、具有较低选案率和较高选案准确率、能够自动进行系统自我平衡、自我控制的选案系统。下面根据不同部分的功能进行具体的描述。

    ( 一 ) 计算机一次选案

   系统从不同的方面,选择不同的选案模型,应用不同的选案标准,对纳税人的财务状况进行多方位的考核,从而对纳税人偷逃税款行为的可能性进行评估,为后期高效、准确地筛选出最可能偷逃税款的纳税人建立数据基础。

    ( 二 ) 计算机二次选案

   系统在进行了计算机一次选案后,生成了大量的稽查问题,使得系统选案率较高且重点不突出,不利于有效地降低选案率、提高选案准确率。在本环节,系统充分利用各个选案指标的加权点数和各个稽查问题的偏差率,形成以选案问题数量、累计加权点数和累计综合点数为首的综合评估体系,对每个纳税人的财务状况进行整体评估,突出重点,有效地降低选案率,提高选案准确率。

    ( 三 ) 人机结合选案

   在经过计算机二次选案后,系统已经能够提供质量较高的案源。但是由于计算机本身的局限性,这些案源仍然需要与纳税人的实际经营情况进行结合,具体地判断纳税人是否有偷逃税款行为。经过人机结合选案后,系统将确定要进行立案的案件。

    ( 四 ) 立案

   本环节主要对经过人机结合选案最后确定下来的案件进行立案处理,为以后进行稽查反馈建立数据基础。

    ( 五 ) 稽查信息反馈

   系统根据稽查部门的稽查结果,对立案的案件依据查实的稽查问题逐项进行反馈,为系统自动调整选案指标的加权点数提供依据。

    ( 六 ) 选案指标加权点数的自动修订

   系统根据稽查信息反馈的结果,依据各个选案指标在实施稽查过程中的准确性、有效性,对那些有效的稽查指标自动地调增其加权点数,而对那些无效的选案指标自动地调减其加权点数,使得在下一次选案过程中有效的选案指标对选案的贡献度增大,而无效的选案指标对选案的贡献度减少,从而达到系统自我调节、自我平衡、自我控制,有效地提高选案准确率。

   三、稽查选案系统选案模型的分类及其适用范围

   稽查选案系统涉及到纳税事宜的方方面面,小到数据填写、录入错误,大到情况复杂、种类繁多、形式多样的确偷逃税款案件。如果想以一种简单的算法解决所有的选案问题,显然是不可能的。可是根据每个选案问题都制定专门的算法,势必又会造成管理的混乱和重点不突出。如何根据选案问题的不同,进行细致的分类、统一的管理,已经成为一个亟待解决的问题。下面根据选案方法及反映问题的不同进行分类并对其适用范围进行说明:

    ( 一 ) 数学模型 1 :表内、表问算术关系错误

   数学模型: F(a , b ,… ) = x

   例子:《申报表》中本期进项税额合计错误。

   其中: x 为“本期进项税额合计数”; a 为“本期发生额合计数”; b 为“免税货物合计数”; c 为“非应税项目合计数”; d 为“非常损失合计数”; e 为“简易办法征税货物合计数”; F(a , b , c , d , e) 为 a — b — C — d — e 。

   如果 F(a , b , c , d , e) <> x ,则说明纳税人报送的申报表算术关系错误,原因可能是由于计算、填写错误或有偷逃税款行为。

   适用范围:处理纳税人财务报表、发票及附报资料表内及表间算术关系错误问题。

    ( 二 ) 数学模型 2 :表内、表间逻辑关系错误

   数学模型:如果 F(a1 , b1 ,… ) > 0 ,则 G(a2 , b2 ,… ) > 0 。

   例子:非正常损失是否作进项税额转出。

   其中: a1 为《资产负债表》中“待处理流动资产损失”本月期末数; b1 为《资产负债表》中“待处理流动资产损失”上月期末数; a2 为《申报表》中进项税额转出栏“非正常损失”; F(a1 , b1) 为 a1 - b1 ; G(a2) 为 a2 。

   如果 F(a1 , b1) > 0 ,而 G(a2) ≤ 0 ,则说明纳税人报送的资料逻辑关系错误,原因可能是由于计算、填写错误或有偷逃税款行为。

   适用范围:处理纳税人财务报表、发票及附报资料表内及表间逻辑关系错误问题。

    ( 三 ) 数学模型 3 :财务指标波动超过特定的警戒范围

   数学模型: x < F(a , b ,… ) < y

   例子:工业企业税负低于 1 或高于 4 。

   其中: a 为《申报表》中“应纳税额”本月数; b 为《申报表》中“应税货物销售额”本月数; x 为 1 ,本参数由人为统计得出; y 为 4 ,本参数由人为统计得出; F(a , b) 为 a / b 。

   如果 F(a , b) > y 或 F(a , b) ≤ x ,则说明纳税人税负波动异常,超过了系统给定的波动范围,那么纳税人偷逃税款的可能性将增大。

   适用范围:监控各种财务指标是否偏离警戒范围。

    ( 四 ) 数学模型 4 :财务指标波动超过特定平均水平的严重程度

   数学模型: x = F(a , b ,… )( 鉴于该模型较复杂,不作具体描述 )

   本模型包括复杂的构造过程,模型具有独特的财务指标平均值及有效偏差范围的生成策略、稽查选案策略、衡量财务指标异常程度的策略及财务指标分析的功能。

   例子:企业财务指标超过同期同行业财务指标允许的波动范围。

    1 .财务指标平均值及有效偏差范围的生成策略。

    (1) 各行业当期平均值的计算方法。

   根据基础数据计算当期纳税人的财务指标数据或按行业分类,计算各行业财务指标的算术平均值。

    (2) 各行业当期有效偏差范围的计算方法。

   按行业分类,计算各行业中所有纳税人财务指标与行业财务指标算术平均值差值的绝对值的算术平均值,作为同行业的有效偏差范围。

    2 .稽查选案策略。

   纳税人的财务指标在行业财务指标算术平均值有效偏差范围内的,认为其纳税行为正常,而将范围外的认为纳税行为异常,并列入稽查选案范围之内。

    3 .衡量财务指标异常程度的策略。    将 ( 纳税人当期财务指标-相关平均财务指标 ) /相关有效偏差范围,作为衡量财务指标异常程度的标尺,偏差率。

    4 .财务指标的分类及其作用。

   根据财务指标数据的来源及其反映问题的不同方面,可以将财务指标分为以下 3 类:同行业本期平均数和本期偏差范围、同行业历史平均数和历史偏差范围、纳税人历史平均数和历史偏差范围。

    (1) 同行业本期平均数和本期偏差范围。

   该类指标反映了当期各个行业整体的经营形势,特点是变化灵活,较能反映本期各个行业的经营特点。

    (2) 同行业历史平均数和历史偏差范围。

   该类指标反映了较长时期内各个行业整体的经营情况,特点是指标较为稳定,惯性较大。

    (3) 纳税人历史平均数和历史偏差范围。

   该类指标反映了较长时期内纳税人的整体经营情况,特点是指标能够较好地反映纳税人自身的经营特点,同时指标较为稳定。

   在该模型中,参数 x 为选案指标的偏差率,表示财务指标发生异常的程度,参数 x 越高说明偷逃税的行为越严重。本模型不需要外界指定任何参数,而是根据自身的算法确定有效的选案参数,系统具有较高的稳定性和较好的自我控制能力。

   适用范围:通过函数 F(a , b ,… ) 的返回值 x 来衡量各种财务指标波动超过特定平均水平的严重程度,该模型主要用来对纳税人的各种财务指标进行深层次的分析。

    ( 五 ) 数学模型 5 :关联财务指标的随动性

   数学模型:如果 F(a1 , b1 ,… ) > 0 ,则 G(a2 , b2 ,… ) > 0 ;如果 F(a1 , b1 ,… ) < 0 ,则 G(a2 , b2 ,… ) < 0 。

   例子:商业企业购销比率与应收账款周转率是否同步变化。

   其中: a1 为《损益表》中“本月销售收入”; b1 为《资产负债表》中“本期应收账款”; c1 为上期《资产负债表》中“本期应收账款”; d1 为上期应收账款周转率; a2 为《损益表》中“本月销售收入”; b2 为《销项发票明细账》中“本期购入商品金额”; c2 为上期购销比率; F(al , b1 , c1 , d1) 为 a1*100 / [(b1 + c1) / 2] - d1 ; G(a2 , b2 , c2) 为 a2*100 / b2 - c2 。

   如果 F(a1 , b1 , c1 , d1) > 0 ,而 G(a2 , b2 , c2) < 0 ;或 F(a1 , b1 , c1 , d1) < 0 ,而 G(a2 , b2 , c2) > 0 ,则说明该纳税人的财务报表违反了相应的财务理论,纳税人极可能有偷逃税款行为。该模型反映了两种财务指标间相互关联的随动效应。

   适用范围:处理具有相互关联、相互制约的财务指标间的关系。

   四、几类数学模型的优缺点及其性能分析

    ( 一 ) 数学模型 1 和数学模型 2 的优缺点及其性能分析

   发现问题的原因:计算、填写错误或有偷逃税款行为等。

   优点: (1) 设计简单,易于实现; (2) 不存在人为因素,客观、公正; (3) 准确率较高。

   缺点:这两个模型只能处理一些简单的表内、表间平衡问题或根据财务指标间的内部关联特性检查出一些简单、明显的偷逃税款行为。处理问题较为单纯,同时查出的问题也较轻微。

   性能分析:由于这两个指标查出的问题准确率较高,因此不需要再进行后继的案件筛选操作,可以直接进行相关的稽查处理。同时由于所涉及的问题较为轻微,一般不需要进行立案处理。

    ( 二 ) 数学模型 3 的优缺点及其性能分析

   发现问题的原因:纳税人确实有偷逃税款行为并在财务报表中进行了反映或由于财务指标本身异常而造成的误报。

   优点: (1) 设计简单,易于实现; (2) 适用范围广、适应性强。

   缺点: (1) 该模型存在人为因素,容易出现不公正、不客观的问题; (2) 反映问题的层次相对较浅,不能反映财务指标内部深层次的特点; (3) 只能反映纳税人相关财务指标异常,而不能反映问题的严重程度; (4) 选案指标中参数 x 和 y 是由人为事先确定的,因此模型灵活性较差,且可能由于参数 x 和 y 的选择不当而造成选案准确率的下降; (5) 各种选案指标都具有自身特有的参数 x 和 y ,增加了系统的管理负担,降低了选案的准确率; (6) 该模型只能反映当期的财务状况,不能反映纳税人及相关行业的整体情况。

   性能分析:该模型算法较为简单,不能反映纳税人财务指标的异常程度,选案率较高而选案准确率较低。

    ( 三 ) 数学模型 4 的优缺点及其性能分析

   发现问题的原因:纳税人确实有偷逃税行为并在财务报表中进行了反映或由于财务指标本身较差而造成的误报。

   优点: (1) 不存在人为因素,非常客观、公正; (2) 能够根据具体的使用环境,自动计算出合理的同行业平均值及其偏差范围,模型具有较强的稳定性和可靠性; (3) 能够通过偏差率客观、公正地反映纳税人财务指标异常的严重程度,并在偏差率的基础上建立统一的财务指标异常标准; (4) 能够根据实际的数据情况、很好地控制选案率并保证较高的选案准确率; (5) 能够从多方面、多角度、多层次反映纳税人的财务状况; (6) 能够在深层次上反映纳税人财务指标的异常情况; (7) 整个模型智能程度较高,非常易于管理和维护。

   缺点: (1) 该模型设计复杂,涉及到较深的数学理论; (2) 适用的范围专业性较强,不能转化为率的指标不能通过本模型实现; (3) 该模型的稳定性和准确率依赖于大量准确的基础数据,在数据量较少的情况下本模型的准确率及稳定性较差。

   性能分析:由于该模型的算法建立在人工智能及自动控制理论的基础上,因此系统的稳定性及准确性均较高,且较少需要人为干预。

    ( 四 ) 数学模型 5 的优缺点及其性能分析

   发现问题的原因:纳税人确实有偷逃税行为并在财务报表中进行了反映或由于财务指标本身恶化而造成的误报。

   优点: (1) 选案准确率较高; (2) 能够在深层次上反映纳税人财务指标的异常情况。

   缺点: (1) 设计复杂,涉及到较深的财务理论; (2) 存在人为因素,难于做到完全客观、公正; (3) 选案时需要人机紧密结合,选案人员必须具有较高的选案理论和选案经验,选案的自动化程度较低; (4) 只能反映纳税人财务指标异常,不能反映财务指标异常的严重程度; (5) 适用的范围专业性较强,不具有内在关联特性的财务指标不能通过本模型实现。

   性能分析:该模型的准确率较高,但适用的专业性最强,需要选案人员具有较高的实际稽查经验和理论基础。

    ( 五 )5 种选案模型的统一管理

   通过分析可以看出,模型 l 和模型 2 选案准确率极高,没有进行计算机二次选案的必要,也不具有加权点数、偏差率等特征。模型 5 具有较强的人机结合能力,选案准确率很高,也没有进行计算机二次选案的必要,不具有加权点数、偏差率等特征。因此模型 1 、模型 2 和模型 5 在经过计算机一次选案后可以直接进行人机结合选案及实施稽查,同时因为模型 1 、模型 2 和模型 5 不具有加权点数等特征,因此与加权点数相关的立案、稽查信息反馈及选案指标加权点数的自动修订操作均不需要进行。模型 3 具有加权点数的特征,但是因为该模型不能反映问题的严重程度而不具备偏差率的特征,导致综合点数无法确定。在对模型 4 进行了认真的分析后,我们可以发现,模型 4 选出的问题其偏差率至少大于 1 ,在此基础上我们可以假定模型 3 中所有选案指标选出的问题其偏差率均为 1 ,于是模型 3 中各选案指标的综合点数将等于其加权点数。至此,模型 3 和模型 4 实现了模型的统一管理。模型 3 和模型 4 的选案过程将经历计算机一次选案、计算机二次选案、人机结合选案、立案、稽查信息反馈、选案指标加权点数自动修订的每个环节。
页: [1]
查看完整版本: 稽查选案系统数学模型简介 [转帖]