设为首页 - 加入收藏 - 联系我们 欢迎访问赣州民政网!
天气预报:

理论研究

您的当前位置: 首页 >> 学习交流 >> 理论研究
居民经济状况核对业务中的数据规划 ——镇江市核对体系建设的实践与思考
发布时间:2015年02月11日 15:48   文章来源:镇江市民政局社会救助处
  信息工程方法论的基本原理是任何信息系统都以数据为中心,“以数据为中心”的数据规划在当今计算时代不仅仍然有效,而且显得更为重要。就民政部门构建居民经济状况核对系统的本质内容而言,是将分散在政府各相关部门的数据进行整合分析,以期获得对救助申请家庭全面、准确、科学的经济状况评估结果,这就是典型的以数据为导向的信息化系统,其数据规划对核对系统的建设具有重要意义。

  一、镇江核对系统数据规模及遭遇过的“数据危机”

  镇江市的核对系统涉及21个政府部门、有关机构和企业,涉及到核对业务的数据以结构化形式存储在各部门的数据库中,都经过不同程度的范式化处理。但在核对系统建设过程中,我们发现各相关部门当初开发的业务系统,无论是数据格式还是数据访问方式,都难以建立一个统一的标准和规范。

  如果要求这些部门向民政部门提供核对业务数据,则需要修改与提升原系统的功能、重新组织其数据并形成互连,需要耗费额外的资金,而且仅仅通过维护和修改等打补丁的办法是根本行不通的。因此,出现了所谓“数据处理危机”问题。

  无论是新项目建设还是异构遗留系统整合,实施数据规划是解决“数据处理危机”的关键。

  二、核对业务的数据规划

  民政核对系统建设,是建立在政府各部门的已有信息系统基础上完成数据整合工作。所以,数据规划工作内容不仅仅局限于核对业务所涉及的业务实体本身的分析和定义,而是需要进行数据一致性处理、数据权威发布者界定、数据分类等处理。

  1、数据一致性转换

  数据的一致性处理不同于信息化中的规范化处理。数据一致化工作繁琐而又有必要,在镇江核对系统中,这一工作占用了近30%的工作量。

  数据的一致性是指对来自于不同信息系统的同类数据进行处理,使其数据内容和数据格式保持一致。比如15位和18位身份证号码之间的转换。同时,还表现在不同系统的字典项转换,信息系统往往将实体的属性信息用字典项来描述,比如性别,有男、女、未知等字典项,而在软件系统中这些字典项用编码来表示,不同系统编码标准不一致,造成同一个数据项有不同的编码描述方式,所以需要将这些编码通过映射的方式,转换为一致的字典项。

  2、数据权威发布者界定

  既然核对系统涉及到众多政府部门的数据汇聚,这就造成了对同一业务数据可能会有多种描述,甚至会有冲突。因此,就需要界定一个数据的权威发布者,只有权威发布者,才能够对其发布的数据进行维护。

  然而,权威发布者的界定不是简单地按照谁是数据的“生产者”或者由数据本身的“准确性”来确定,而是要从数据使用者的视角和业务要求来界定。例如,对“救助家庭”这一实体的“权威发布者”界定,这一数据的权威发布来源应该是公安的户籍数据,其对常驻户籍人口有着较为准确的记录和更新。但是,在核对系统中对于在保的家庭成员信息的“权威发布者”并非公安,而是民政,主要有以3个方面原因。

  (1)民政救助对象,比如低保户,其家庭成员的界定并非和户籍人口一一对应,在民政业务中,低保家庭成员定义为“共同生活”人口,而非单纯的同一户籍人口。如果简单地将公安的户籍人口定义为低保户家庭成员数据的权威发布者,从民政的业务要求上来看是错误的。

  (2)救助对象的“赡抚养人”信息也由民政业务所关注,这些人出现在“救助审批单”中,虽然他们不是家庭成员,但是必须要参加“经济状况”核对,在一些以“家庭”为单位的核对流程里,必须将这些“赡抚养人”视为家庭一员,而在任何一个政府部门的数据里,都没有对“赡抚养人”进行界定和描述。

  (3)公安对死亡人口的掌握没有民政部门和人社部门及时和准确,而死亡人口信息在核对业务里是最重要的数据之一。

  综上所述,在核对业务中将“民政”部门定为“救助家庭”数据的权威发布者更为科学。但是,上述提到的“救助家庭”是作为一个静态实体来分析,而在信息系统中,一个实体在不同业务流程里,会有动态的变化,它的属性数量、状态标记、数据内容都会发生改变。因此,造成对于同一个业务实体的“救助家庭”,在不同流程节点上,它的“权威发布者”并不相同。

  当“救助家庭”还处于“救助业务申请”状态时,民政部门尚未确定其“低保户”(或其他救助类型)身份,从“救助业务申请单”上看,民政只掌握其“自主申报信息”并不能作为“信息权威发布者”。“救助申请人”可能因为各种原因,瞒报或多报家庭成员数量,而这些信息正是民政在受理救助申请时所关心的重要内容。因此,在“救助业务申请”状态时,公安才是“救助申请家庭”数据的权威发布者,而只有在救助申请流程结束,并且“救助申请家庭”通过审批成为“民政救助对象”后,民政部门才变为“救助家庭”数据的权威发布者。

  3数据分类

  数据分类是核对系统一个特有的工作步骤,从不同部门获取的基础数据按照数据的特点和使用方式进行分类,要制定不同的数据访问、存储和使用策略。例如,镇江市的殡葬数据,“死亡人口”信息在殡葬系统本地数据库留存,月底上传至核对服务器。“殡葬”数据从其特征来看属于数据量小、而变化频次低,死亡人口数据一旦增加,则不会变化,并需要长期累积存储,这类数据在核对系统中被分类为“全量数据”。所谓全量数据,是指与其他部门只反馈救助申请对象的数据比较而言,“全量”体现在数据是全市所有的死亡人口数据,而非仅仅是救助申请对象。这类数据从更新方式上采用“定期收集”,在存储策略上采用“累加存储”。一旦在发起核对申请的请求时,系统在“全量”类数据中完成实时比对,发现救助申请人是死亡人口时,则马上提示操作者,而不需要进行后续的核对流程。

  与“殡葬”数据相比,像人社部门和公积金部门的数据则变化频度高,数据量大,无论从技术角度还是从数据安全保密的角度出发,都无法采用与“殡葬”数据相同的数据采集存储策略。这类数据在镇江核对系统中被归类为“接口调用”类数据。所谓“接口调用”是指在发生核对业务请求时,核对系统调用人社局或交通局的软件接口,进行实时按需的数据交换,民政局将需要核对的人员名单提交给参与核对的部门,各部门将查询的结果通过软件接口再反馈给民政局。而更多的部门由于网络等问题,无法实现实时对接,被统一划分为“外部导入”数据方式。这些数据在软件系统之外通过平面数据文件的形式进行手工交换,由于手工操作的介入,使得约定好的数据文件格式很难被长期一贯地遵守,因此,核对平台要为这些数据准备专用的数据清洗导入模块,完成数据一致性检查、文件格式适配和解析。

  只有对数据正确地分类,制定不同的数据采集、清洗、使用的策略,才能够全面科学地处理来自于不同部门的业务信息。

  三、结论与展望

  在核对系统数据环境建设过程中,必须要有全面、整体、共享的数据管理思维,转变过去“数据拥有者”或“权力控制”等思想,应在所有政府部门内实施数据的标准化管理和全统一规划,即建立信息资源管理的基础标准和信息资源规划。

  通过进行核对业务总体数据规划,完成数据的一致性转换、数据权威发布者界定和数据分类的处理,可以高效地处理异构数据,解决“信息孤岛”问题。同时,基于信息资源规划,有步骤地实现数据环境重建,最终建成高效的数据环境——以主题数据库和数据仓库为主体的数据环境,为最终消除接口、整合应用打下良好基础。