面向公共信息平台的税收失信企业信用特征分析
  • 当前位置: 首页    信用研究

  本文分析判断及其结论所采用的数据仅仅来源于信用浙江公共信息平台,而非各失信惩戒部门即税务部门第一手数据,其结论有失偏颇。但这样偏差更能说明有必要探讨各信息源数据质量和数据公开共享时效,从而考察基于公共信用信息平台联合惩戒的效果。
  按照浙江省社会信用体系建设“十三五”规划,我省将进一步加强信用信息公开和共享,依法依规运用信用激励和约束手段,构建政府、社会共同参与的跨地区、跨部门、跨领域的守信联合激励和失信联合惩戒机制,促进市场主体依法诚信经营,维护市场正常秩序,营造诚信社会环境。为了更加有效的实现既定目标,便于信用监管和信用服务机构具体操作,有必要探寻公共信用信息平台数据归集和数据信用特征提取,从而考察公共信用信息平台数据质量和实施联合惩戒效果,并提供相关政策建议。
  一、 公共信用信息平台的数据特征
  公共信用信息是指行政机关、具有社会公共管理职能的事业单位、社会团体在履行职责过程中产生的能够反映市场主体(主要包括企业和个人)信用状况或信用等级的资格、资质、履约、守法或违法以及社会公共活动情况等的记录、信息。公共信用信息可分为基本信息、良好信息和失信信息三类。基本信息包括信息主体的身份信息和相关资格资质信息,良好信息包括表彰奖励、志愿服务、慈善捐赠等信息,失信信息包括欠缴税费、行政处罚等信息。
  公共信用信息平台主要依托法人信用基础数据库、自然人信用基础数据库、以及其他跨部门信息共享系统,通过对行政部门、司法部门、公用事业单位在履行职责过程中生成的信用信息的整合,面向社会提供信息查询、信息对比等服务,满足政府、个人、企业、金融机构和信用服务机构的信息使用需求。
  公共信用信息平台的数据一般具有海量性、异构性、多源性、高维性和时序性的特征。
  1. 海量性。基于金融监管、社会诚信建设和社会治理的需要以及大数据时代的变革,公共信用信息平台上汇集了大量的数据,这些数据由于其海量性而形成数据库,主要包括法人信用基础数据库、自然人信用基础数据库、以及其他跨部门信息共享系统。例如,信用浙江平台的失信黑名单栏目汇集了包括浙江省国税局、浙江省人力社保厅在内的17 个不同部门的失信信息,其中,除了上海铁路局发布的主观故意违章乘车失信黑名单是自然人失信信息、浙江保监局公布的保险代理人失信黑名单和旅行社业务经营失信黑名单外,其余13 部门发布的黑名单信息大多涉及企业失信信息,即法人失信信息。
  2. 异构性。公共信用信息平台上的数据具有异构性是指这些数据具有不同的结构,包括数据格式的异构、数据类型的异构、数据精度的异构、数据量纲的异构、数据存储地点异构、数据存储的逻辑模型异构等。例如,在重大税收违法黑名单中,数据的类型包括字符型、数值型和日期型,数据的精度既有整数,又有保留到两位小数。
  3. 多源性。数据的多源性一方面是指公共信用信息平台上的数据来源渠道多样化,可以来自不同地区、不同部门、不同机构、不同单位和不同行为主体(企业法人和自然人),另一方面是指数据来源越来越多元化、层次化和非结构化。例如,信用浙江平台上的失信黑名单信息来自不同地级市、17 个不同机构、企业和个人两个不同的行为主体,且数据来源呈现多元化的趋势。
  4. 高维性。高维数据是公共信用信息平台中常见的、也是最为关键的数据,是信用特征选择和信用特征提取的重点。高维数据会导致数据量大,计算复杂,难以提取有价值的信息等问题。例如,重大税收违法黑名单信息中的文档词频数据就是高维数据。
  5. 时序性。公共信用信息平台上的数据一般具有时序特征,经济领域的时间序列大多是非平稳的,而这些非平稳的时间序列具有某些典型的数据特征。例如,重大税收违法黑名单信息中的发布时间、发布期限、处罚时间和工商注册日期均具有时序性的特点。
  信用浙江公共信用信息平台是国内建设最早的平台之一,最受关注的是失信黑名单栏目。截止2017 年4 月底,该栏目汇集了浙江省国税局等17 个部门的黑名单信息,共1980 条;其中,失信黑名单信息最多的是上海铁路局公布的主观故意违章乘车行为失信信息,达1666 条,但这些失信黑名单信息主要是个人信息。而涉及企业黑名单信息最多的是国税局公布的国税重大税收违法黑名单;加之地税局公布的重大税收违法黑名单,税收失信信息总量占整个平台公布的企业黑名单信息超过5 成。鉴于数据的可得性、统一性、可操作性的考虑,下文60 家重大税收违法黑名单企业信息采集时间截止2016 年10 月。该税收失信信息具有与上述公共信用信息平台数据的海量性、异构性、多源性、高维性和时序性的特性相同,并能为信用特征提取方法提供选择依据。
  二、 浙江税收失信企业的信用特征提取
  信用浙江平台上公布的税收失信企业信息包括处罚信息和企业信用档案信息两类,这些信息可用于进行信用特征提取。
  文本挖掘就是从大量的文档中发现隐含知识和模式的一种方法和工具, 文本挖掘的对象是海量、异构、分布的文档(web); 文档内容是人类所使用的自然语言, 缺乏计算机可理解的语义。传统数据挖掘所处理的数据是结构化的,而文档(web) 都是半结构或无结构的。所以, 文本挖掘面临的首要问题是如何在计算机中合理地表示文本, 使之既要包含足够的信息以反映文本的特征, 又不至于过于复杂使学习算法无法处理。文本的表示及其特征项的选取是文本挖掘、信息检索的一个基本问题,它把从文本中抽取出的特征词进行量化来表示文本信息。将它们从一个无结构的原始文本转化为结构化的计算机可以识别处理的信息,即对文本进行科学的抽象,建立它的数学模型,用以描述和代替文本。使计算机能够通过对这种模型的计算和操作来实现对文本的识别。
  三、 税收失信企业的信用特征
  根据税收失信企业的各类非财务文本信息,通过文本特征提取,浙江省60 家税收失信企业信用特征可概括为如下三个方面。
  (一)宏观经济视角的信用特征
  基于宏观经济视角,根据税收失信企业的区域分布和处罚时间分布特性,其信用特征如下:
  1.税收失信企业分布存在显著的区域性差异。
  税收失信企业数量排名前三的浙江省地级市分别为绍兴市、杭州市和衢州市,三地违法企业数量之和为总量的三分之二,共40 家,其中绍兴市失信企业数量为18 家,占了将近三分之一,杭州市和衢州市均有11 家失信企业上黑名单。金华市、台州市、温州市、丽水市可以归为第二梯队,分别有6 家、5 家、3 家、3 家失信企业。湖州市和嘉兴市则分别只有1 家企业上榜,失信企业数量最少。产生这种区域分布差异的原因可能有以下三点:一是近几年国内整体宏观经济下行,再加上互联网经济的爆发式发展,严重阻碍了浙江省各地区实体企业的发展,企业利润空间减少,生产效率低下,致使企业偷漏税行为增多;二是由于绍兴市、杭州市和衢州市小微企业众多,基数大,所以在违约概率相同的情况下,税收失信企业的频数也会较其他地区大;三是税收执法机构的执法力度存在差异,企业税收失信成本偏低,也可能导致税收失信违法企业数量增加。
  2. 税收失信企业季节性特征明显。税收失信企业的处罚时间集中在月末、季末和年末,季节性特征明显;同时也反映税收失信企业经济状况受近年来宏观经济增速下降的影响。
  税收失信企业家数逐年增加,60 家税收失信企业中有一半以上的处罚年份集中在2015 年;处罚月份集中在5 月、9 月、12 月,即季末和年末,其中12 月份处罚了22 家企业,5 月和9 月各处罚10 家;处罚日期分布较广,但31 日的处罚数量相对来说是最多的,即月末。综合来看,税收失信企业的处罚时间集中在月末、季末和年末。产生这种时间分布特征的原因可能如下:一是统计制度和执法监督单位工作性质有关。月末、季末和年末一般是企业发布财务报告的时期,此时暴露的企业税收违法现象较多。执法监督单位在月度、季度和年终工作总结之时才及时上报税收失信企业信息到公共信用信息平台,也表明平台与各数据源的数据动态性和时效性有待加强。二是近三年国内宏观经济增速持续下行,特别是2015 年下半年开始,国内经济严重衰退,实体经济不景气,成本上升,产量过剩,一些企业销售收入锐减,利润大幅度降低,客观上导致了企业税收失信,税收违法现象严重,违法企业数量暴涨。
  (二)税收执法视角的信用特征分析
  根据税务执法部门的公示效率和对违法企业的处罚事实两方面看,税收失信信息具有如下特性:
  1. 浙江省税务执法部门对失信信息发布不及时,失信信息公示效率存在区域性差异。
  衢州市的税收违法处罚时间和发布时间的平均间隔天数最长,长达545 天,金华市的处罚时间和发布时间的平均间隔天数最短,为149 天。由此可知,对企业税收违法行为的信息共享到公共信用信息平台时效及其税收执法公示效率方面,衢州市与金华市存在较大差异。从浙江省整体来看,税收违法企业处罚时间和发布时间的平均间隔天数为326 天,也就是说,企业在被税务部门发现其违法行为并作出处罚后,平均要在将近一年后才在信用浙江网站上公布。杭州市、衢州市和台州市的平均间隔天数更是大于全省平均值,即便是效率最高的金华市也需要平均五个月时间才公布。由此可知,通过浙江省公共信用信息平台达到联合惩戒效果及其平台发挥作用令人堪忧。2017 年尽管有所改善,但失信违法与平台公示间的时隔仍太长,各地区税收执法部门应引起高度重视。导致各地区税收执法部门公示效率差异的原因是多方面的,但地方税务部门对违法信息公示越重视,公示效率越高,联合惩戒的效果也
越高。
  2. 偷税是税收失信企业采取的最普遍的税收违法手段。税收失信企业的处罚事实包括违法行为、罚款金额以及是否移送司法机关三项内容,以下就各类处罚事实分布情况展开分析。
  信用浙江网站上公布的税收违法企业的处罚事实主要包括非法取得增值税进项发票、骗取出口退税、偷税、虚开普通发票和对外虚开增值税销项发票五项。其中,偷税所占的比例最大,达到42%;其次,非法取得增值税进项发票占比为30% ;排名第三的是骗取出口退税,占比14%。此外,虚开普通发票和对外虚开增值税销项发票的占比分别为6% 和20%。由此可见,偷税是企业最普遍的税收违法手段,究其原因,可能是因为企业主主观认为采取欺骗、隐瞒等方式逃避纳税最为便捷,他们纳税的主观意愿不强,或者因企业经营不善无力缴纳税款,故而偷逃缴税。
  3.税收失信企业涉税金额存在区域和数量上的显著差异。表1 显示,重大税收违法黑名单企业平均涉税金额为1129.30 万元,极小值为1.47 万元,极大值为7070 万元。值得注意的是,从原始数据观察可知,有4 家绍兴的企业偷税金额分别为2.92 万元、3.23 万元、5.53 万元、4.07 万元,涉税金额都很小,但企业主宁愿选择偷税违法也不愿缴纳
这区区几万块钱的税额,其原因可能是企业主自身存在侥幸心理,认为不缴纳小额税款对他们不会有很大的影响,且不会被执法机关发现,另一种原因可能是企业主根本不知道自己有未缴纳的小额税款。综合来讲,企业产生小额偷税现象主要源于企业主法律意识薄弱。
  税收违法企业的涉税金额也存在区域分布差异。金华市的平均涉税金额最高,达到3046.52 万元,紧随其后的是杭州市1320.04 万元和台州市1265.29 万元,全省平均涉税金额为1129.30 万元,除了这三个地区外,其余地区均低于全省平均水平。
  4. 税收失信企业区域平均罚款金额与区域平均涉税金额之间存在反向关系。表2 显示,税收失信企业的平均罚款金额为233.6 万元,极大值为2039.9 万元,极小值为0万元。除了金华市、台州市和衢州市以外,其余地区平均罚款金额均高于全省平均水平,其中,温州市的罚款金额最高,为668.8 万元。值得注意的是,涉税金额较高的金华市、衢州市和台州市平均罚款金额很少,而涉税金额低于全省平均水平的湖州市、嘉兴市、丽水市、绍兴市、温州市罚款金额反而是最高的,由此说明:罚款金额的多少并不会因为涉税金额高而增加,也不会因为涉税金额低而减少,而是更趋向于一种反向关系。
  5. 税收失信企业中税收犯罪的比例高于税收行政违法的比例。依照《中华人民共和国税收征收管理法》等相关法律法规的有关规定,国家税务局和地方税务局对税收违法企业采取的处罚措施有追缴税款的行政处理、罚款的行政处罚(两者统称行政违法)和依法移送司法机关的刑罚处理。在60 家税收失信企业中,有55% 的企业最终被依法移送司法机关,45% 的企业不被移送司法机关,由此可知,这些违法企业中税收犯罪的比例超过一半。
  (三)企业内部情况视角的信用特征分析
  根据重大税收违法黑名单企业信用档案信息,可从企业自身的信誉度、法定代表人情况、行业、企业存续时间、所有权性质五个方面来分析这60 家税收违法企业的内部特征。
  1. 税收失信企业的信誉度均降为D。从税收违法企业的信誉度提示来看,其信誉度提示均为D,D 表示该企业有三条(含)以上失信行为记录。分类信息根据《浙江省企业信用联合奖惩实施办法(试行)》设定,基础数据来源于各政府部门向省公共信用信息服务平台提供的最近3
年的质监、税务、人社、工商、物价、环保、进出口等荣誉和失信信息。
  2. 税收失信企业法定代表人大多来自浙江,男性占多数。浙江省税收违法黑名单企业的法定代表人中有84% 是浙江人,其次分别有9% 的河北人,3% 的四川人,2% 的安徽人和2% 的江西人。此外,从税收违法企业法定代表人的性别来看,男性占据67%,即有三分之二的税收违法人员为男性。
  3. 税收失信企业根据行业属性来分,工业、零售和批发业占主导。依照《国民经济行业分类》(GB/T4754-2011)的行业划分标准,对税收违法企业的信用信息进行特征提取后,可以归纳出税收违法企业所属的行业,并进行分析。
  60 家重大税收违法黑名单企业中,有28 家企业属于工业企业,11 家为批发业企业,排名第三的是零售业和其他未列明行业,各有6 家。笔者认为,出现这种行业分布特点的原因在于,工业和批发零售业中低端企业占比较多,企业规模、产品质量管理人员素质差异较大,品牌形象和社会声誉维护重视程度不一,因此出现税收违法行为的现象较多。
  4. 企业税收违法的概率与其存续期成正比。企业存续期是指企业存在与继续经营的时间段,就是在这个期限之内合同或者权利法定有效或者约定有效。根据信用浙江上公布的违法企业工商注册日期可以计算出企业的存续期。
  表3 显示,60 家企业的存续期最长的有21 年,最短的才1 年,企业平均存续期为9.51 年,中位数为9 年,也就是说,有50% 以上的税收违法企业存续期都在9 年以上,说明企业存续期越长则出现税收违法现象的概率越大。这与理论上百年老店更重视诚信的观点不一致,究其原因,笔者认为可以用企业生命周期理论来解释:企业的生命周期,是企业发展与成长的动态轨迹,包括发展、成长、成熟、衰退四个阶段。企业生命周期变化规律是以12 年为周期的长程循环,普通企业的周期运行顺序一般为:上升期(3 年)、高峰期(3 年)、平稳期(3 年)、低潮期(3 年)(IchakAdizes)。因此,存续期超过9 年的企业一般已经处于低潮期,无论是在经营管理还是财务状况上都将面临挑战,于是税
收违法问题也随之而来。
  5. 有限责任公司和私有企业是企业税收违法行为的主力军。根据《经济类型分类与代码表》(GB/T 12402-2000)的划分标准,私营有限责任公司、私有独资和个人独资企业均属于私有企业,一人有限责任公司属于有限责任公司。在重大税收违法的黑名单企业中,有53% 的企业经济类型是有限责任公司,其中有限责任公司占比48%,一人有限责任公司占比5%。此外,私有企业占比44%,中外合资企业、股份有限公司各占比2% 和1%。直观上似乎可以得出如下结论:企业的所有权性质对其税收违法行为有重大影响,有限责任公司和私有企业是重大税收违法行为的主力军,它们的违法概率与股份有限公司和中外合资企业形成鲜明的对比。其原因可能是这两类企业的所有权结构过于陈旧和单一,内部没有形成良好的治理结构、治理体系和监督约束机制,从而导致税收违法现象频发,却没有形成很好的解决方案。

附件:
表1.png
表2.png
表3.png