赞华集团:物流行业运单影像采集识别及存储管理解决方案
一、概要
1.1用户现状
由于物流快递服务范围日趋扩大及服务能力的日趋提升,物流快递业呈现可喜的增长势头;随着物流快递业务的蒸蒸日上,办理业务所产生的纸质文件也急剧增加,从而导致各揽投部的快递单电子化索引录入人员工作不堪重负,各揽投部在扩大索引录入人员队伍的同时,也急剧加大了运营成本。按照现在的快递单据处理量并考虑到以后工作量的弹性增加,传统的纸质文档管理方式明显不能满足邮政快递业务发展的需要,急需建立一套完整的、自动化的、扩展性强的运单信息管理系统。
1.2需求背景
索引录入任务重:每个揽投部每天需要做索引录入的快递单据少则几百张,多则上千张,任务非常重。
索引录入任务急:为了保证快递业务正常运转,工作人员必须在当天完成快递单索引录入工作,导致工作人员经常加班到深夜。
人力成本严重浪费:为了保证快递单索引录入工作在当天完成,各揽投部必须投入人力尽可能充足。由于揽投部的数量大,物理位置分散,无法做集中索引录入,人力资源无法有效集中利用。
索引录入效率低:工作人员需对着纸质真实单据做索引录入,注意力需在电脑屏幕和纸质单据中频繁切换,需从密密麻麻的纸质单据内容中定位关键字段信息,录入效率非常低且极易出错。
手工整理快递运单:每录完一张快递运单,需整理后才能接着录下一张快递运单的索引信息,严重影像了工作的连续性。扫描过的运单如果不及时整理容易被丢失。
查单效率低下:查询源起于客户对某笔快递业务存在疑问,需要查看原始快递运单;或者邮政工作人员在索引录入环节出错,导致快递无法被投递等等都需要查看原始的运单来定位出错的原因。
现状 查询时间
查找已投递的快递运单 需要专人到档案室查找:
其中1天~3天内的档案需要5分钟/份;
1个月~3个月内接近30分钟/份 。
查单流程存在问题:
1.3系统设计目标
集中扫描识别,提高录入工作效率
使用高速扫描仪集中扫描,并通过先进的OCR识别引擎集中识别关键信息和条码,加快业务处理速度和减少处理时间,消除现有工作方式下的作业瓶颈。各揽投部只需要对纸质运单扫描并上传到总部,由总部统一识别索引并进行管理。
◆ 降低索引录入成本
粗略估算,对于一个有1500个揽投部的物流公司,以平均每个揽投部已投入两个扫描录入人员为例,该方案大概能为客户节省成本近四千万,降低成本接近48%。具体计算方法参见“实施成效”分析。
◆ 科学的流水线工作机制
每张单据的索引录入工作都要经过扫描、图像检查、索引录入、发布等四个环节,充分利用人力资源有效提高生产率。
◆ 完善的工作量统计以及错误追踪机制
管理层普遍都会关心如何对工作人员进行合理的绩效考核,结合客户实际情况,对每位工作人员的工作量进行实时统计;提供错误追踪功能,当出现数据有误时,能够追踪到是哪位录入人员工作失误所致。
◆ 降低存储和管理的成本
传统的处理方式与文档资料的保存、管理相关的劳动成本、存储空间(如档案库房)的成本在不断增加,使用赞华运单采集管理系统,降低了对存储空间的要求,大大减轻了档案工作人员的工作量,提高了日常管理效率。
◆ 文档资料实时共享
不同地区可跨地域进行文档资料的处理和查询。。。。。。
1.4业务流程应用描述
速递单据资料整理:对单据进行整理,去除安装钉、黏胶等,将资料进行分类、整齐等操作,作好扫描准备工作。
高速扫描:通过富士通高速扫描仪将经过分类整理的单据纸张转换成电子影像文件保存至影像采集平台,对影像文件的质量进行监控,对质量差的影像进行重扫,对漏掉的文档进行补扫。
处理和存储影像:接收完各网点上传的扫描图像后,统一在影像采集平台对上传的扫描图像做OCR识别和索引录入工作,录入工作完成后,将图像以及索引信息打包发布至内容管理平台。
图像查询:经过整理、扫描、归档几个过程,形成一个安全、灵活、方便的电子影像档案库,通过计算机网络(intranet/internet)实现速递单据快速查询。业务流程如下:
二、解决方案
2.1 整体方案概述
根据运单采集管理需求,推荐<富士通高速扫描仪+赞华公司自主研发的DocuMan Capture影像采集平台+DocuMan UContent内容管理平台>作为解决方案的选用产品。利用富士通扫描仪和Capture实现采集和处理,以UContent作为内容管理系统的基础,遵循统一的体系架构模式和技术规范标准,依据核心功能逐步完善运单内容管理应用体系,从而最终达到统一管理运单非结构化数据的目的。
DocuMan Capture作为数据采集平台系统,具备灵活性和可扩展性,在可自定义工作流流程的基础上完成数据的扫描、识别、补录和发布过程,同时,建立完备的权限体系,在信息共享的基础上保证了数据的安全性和完整性。
DocuMan UContent作为通用的内容管理系统,它在保证灵活性和扩展性的基础上,完成内容的存储、查询、版本管理并且设立了完备的权限体系,使信息得以共享,从而实现了运单内容管理自动化。
DocuMan Capture和UContent的技术优势:
高效数据采集:Capture作为一款通用的数据采集平台,可根据客户业务需求定制数据采集流程,并在图像扫描和识别过程中支持各种图像处理与识别方式。例如:通过统一的采集平台,扫描完成后的数据自动上传到数据中心归档;
强大的识别引擎:条码识别率达到96%以上。可识别各种条码、打印体文字、数字等。
固定格式的快递单
非固定格式的快递单
统一影像管理:为行业上层业务系统提供统一的影像采集、创建、展示、编辑、存储、传输、查询接口。例如,Capture采集完成后的数据既可以通过Ucontent提供给用户查询,也可以提供API给其他业务系统调用,还可以在统一的内容管理平台上设计新的业务应用。
海量业务支撑:UContent面向企业级应用,支持超过百万级海量数据。
可扩展和可移植性:UContent作为内容管理平台,可以适应各种非结构化信息如传真、电子邮件、网页、多媒体文档、办公文档(诸如各类Office文档)的管理需求。UContent可以有效管理不断增加的内容容量、高流量负载、更多的用户和复杂的工作流,同时保持高效的系统性能。同时,平台无关性使得系统可以在多种操作系统中迁移。
影像生命周期管理:UContent为行业上层业务系统提供统一的内容(包括影像)生命周期管理,统筹管理各类内容从建立、管理、发布、归档到离退的整个生命周期;支持在分层(在线、近线、离线)存储条件下,依据内容的不同生命状态在不同存储层次进行数据迁移。
法规遵从性:UContent在核心元数据定制和索引定制方面遵循了国际规范,在版本管理和生命周期管理方面满足法律和法规遵从的需求。
内容共享和发布:UContent和Capture都可以根据内容类型来进行不同模式的权限控制,根据和生命周期等相关联的内容管理服务控制来达到不同内容的不同管理模式,实现模式内的共享和模式间的分离,并可以定制内容的发布策略,使内容价值得以体现。
易用性、可靠性、安全性、灵活性等。
2.2系统架构图
DocuMan UContent服务器:1台,将FTP服务器中的影像数据自动导入
UContent服务器,作为内容管理系统的基础,实现速递单据影像的归档和查询/调阅。
扫描数据采集点:各揽投部安装一套Capture单机版采集软件以及一台富士
通彩色扫描仪。总部安装一套Capture网络版采集软件。
查询客户端:多个,按所需查询站点个数而定。
富士通高速扫描仪:多台,视具体业务量而确定数量及型号,富士通FI系列高速扫描仪如下图:
2.3实施成效
大大降低了索引录入人力成本
粗略估算,以一个有1500个揽投部的物流公司为例,以平均每个揽投部已投入两个索引录入人员估算:假设每个揽投部做索引录入的实际工作量需要1.5个人来承担,因为目前的工作方式是由各揽投部来承担索引录入工作,所以1.5个人的工作量必须由两个人来完成,才能保证索引录入工作当天完成。但是如果采用集中录入的方式,就能最有效的集中利用劳动力,降低成本。
目前工作方式:
每个人工资:30,000元/年;所需索引录入人员:1500×2=3000人
索引录入所花费总成本:3000×30,000=90,000,000元
采用票据电子化并做集中录入方式后:
每个人工资:30000元/年;所需索引录入人员:1.5×1500×70%=1580人(Capture对纸质票据先做电子化再做关键信息OCR自动识别,保守估计可提高效率30%)
索引录入所花费总成本:1580×30,000=40,740,000元
本方案每年能节约成本金额总数:90,000,000-40,740,000 = 40,260,000元
降低成本百分比:47.33%
无论身处何地,通过条形码查找运单,即查即得
业务 原来 运单电子化后
查找已投
递的运单 专人到档案室查找,当天--3天内的需要5分钟/份;1个月内---3个月内接近30分钟/份 3—5秒钟
三、存储典型方案应用
随着业务量的增加,保留在服务器上的影像文件将快速增长,在项目初期构建好完善的存储备份系统尤为必要,否则一旦服务器空间负载过重,可能会导致系统瘫痪,数据丢失的严重后果。
下图为影像采集管理系统做存储备份的典型应用供参考:
注:以下简要介绍产品方案特点,具体存储方案视客户的实际应用需求再深入展开。
NetApp 产品技术的优点:
统一存储解决方案
NetApp 企业存储系统的作用相当于“统一引擎”,同时支持光纤通道 SAN 、 IPSAN 存储区域网络 (iSCSI) 和网络附加存储 (NAS) 。这样,您可以集中精力满足应用程序需求而不是技术,同时确保存储网络能够无间断地为您提供支持,满足长期存储需求。
低成本,高回报率
一项独立的调查研究表明:与数据库环境中 竞争对手的存储解决方案相比,
Network Appliance 能使【总拥有成本】( TCO )的降幅直逼 70% ,从而极大
地改善了投资回报率( ROI )。
简易管理
Network Appliance 的统一管理平台,使 IT 管理人员易于 操作系统; 透过基于浏览器的管理工具( FilerView ),允许在浏览器上远程全面管理存储系统。
高可靠性
Network Appliance 存储系统提供了经过实践考验的、超过 99.998% 的数据可用性,减少了代价高昂的停机时间(无论是计划内的还是计划外的),最大限度地保障了对关键数据的访问。
高性能
NETAPP FAS 产品系列提供了业界领先的【吞吐量】 ( Throughput ) 和极短的【响应时间】。为了对系统的运行情况进行连续监控,延长正常运行时间, NetworkAppliance 采用了集成而又独立的管理处理器。
可扩展性
实现了即时的可扩展性,能够在一套单一系统或是多 Filer 的配置环境中支持数千名用户和数千作业处理以及数万亿字节的信息。
高灵活性
支持存储访问协议包括 NFS 、 CIFS 、 iSCSI 、 FCP 和 HTTP ,可运行在 GbE 、光纤通道以及 SCSI (用于备份)等标准类型的连接上。