学术研究

赞华集团:物流行业影像采集及存储管理解决方案

发布时间 | 2016年02月24日 14:22:13

 

 

方案一:某汽车物流资料电子化方案

1、概要

1.1、用户现状

某汽车公司有大量的历史及现有的物流资料档案,如:商品车验收交接单,目前客户历史资料大概在300万页左右,每年的新增数据大概在20万左右。这些资料目前均以纸质文档存放在仓库,在业务过程中,需要调阅相应的文档,查找非常困难、耗时,并且文档要求保留10年以上。

1.2、需求背景

纸质文档容易损坏:长时间存放纸质文档,由于物理环境因素,纸张发霉变黄损坏,导致重要信息的丢失;

纸质文档管理难:纸质文档长期存放在仓库,专用大量的库房空间,需要投入大量人力、物力进行管理;

纸质文档查找难:需要调阅相应文档时,耗时、耗力,查找困难;

纸质文档无法共享:同一个时间地点,纸质文档只能一人使用,不能进行信息共享;

1.3、系统设计目标

为了解决这些问题,使用高速扫描仪集中扫描纸质的物流资料档案,完成纸质文档的电子化;并通过先进的OCR识别引擎识别关键信息,自动识别添加索引,加快处理速度和减少处理时间,最后将图像存储在影像管理系统中,供相关人员进行查询、在线调阅,提高工作效率并减少人工的使用。

2、解决方案

2.1、整体方案概述

结合客户运营现状,引入先进的富士通扫描仪,结合我司自主研发的成熟产品DocuMan Capture影像采集平台和DocMan Ucontent内容管理平台,将为之定制一套高效的解决方案。

DocuMan Capture和UContent的技术优势:

(1).高效数据采集:Capture作为一款通用的数据采集平台,可根据客户业务需求定制数据采集流程,并在图像扫描和识别过程中支持各种图像处理与识别方式。例如:通过统一的采集平台,扫描完成后的数据自动上传到数据中心归档;

(2).强大的识别引擎:条码识别率达到96%以上。可识别各种条码、打印体文字、数字等。

(3).统一影像管理:为行业上层业务系统提供统一的影像采集、创建、展示、编辑、存储、传输、查询接口。例如,Capture采集完成后的数据既可以通过Ucontent提供给用户查询,也可以提供API给其他业务系统调用,还可以在统一的内容管理平台上设计新的业务应用。

(4).海量业务支撑:UContent面向企业级应用,支持超过百万级海量数据。

(5).可扩展和可移植性:UContent作为内容管理平台,可以适应各种非结构化信息如传真、电子邮件、网页、多媒体文档、办公文档(诸如各类Office文档)的管理需求。UContent可以有效管理不断增加的内容容量、高流量负载、更多的用户和复杂的工作流,同时保持高效的系统性能。同时,平台无关性使得系统可以在多种操作系统中迁移。

(6).影像生命周期管理:UContent为行业上层业务系统提供统一的内容(包括影像)生命周期管理,统筹管理各类内容从建立、管理、发布、归档到离退的整个生命周期;支持在分层(在线、近线、离线)存储条件下,依据内容的不同生命状态在不同存储层次进行数据迁移。

(7).法规遵从性:UContent在核心元数据定制和索引定制方面遵循了国际规范,在版本管理和生命周期管理方面满足法律和法规遵从的需求。

(8).内容共享和发布:UContent和Capture都可以根据内容类型来进行不同模式的权限控制,根据和生命周期等相关联的内容管理服务控制来达到不同内容的不同管理模式,实现模式内的共享和模式间的分离,并可以定制内容的发布策略,使内容价值得以体现。

(9).易用性、可靠性、安全性、灵活性等。

2.2、系统架构图

 

2.3、流程简介

 

2.4、产品配置

序号 产品名称 功能描述 数量

1 DocuMan Capture 1)数据采集客户端(扫描,自动识别,人工复核,发布)

2)搭建采集服务器(自动模块) 1

(单机版供一人使用)

2 DocuMan uCotnent 1)影像文件存储、查询、在线调阅,安全管理 1

(影像管理服务)

3 DocuMan uContent Web User 影像文档管理系统客户端,通过IE访问服务 5

(同时支持5个在线拥有)

4 扫描仪 高速扫描仪 1

5 高性能PC机 采集软件部署PC机器 1

6 高性能服务器 影像文档管理系统部署PC机器 1

3、实施成效

全面实现了客户纸质物流资料档案的电子化扫描、图像自动分类、图像识别、图像存储、图像查询、图像在线浏览及等目标,最大程度降低该环节的人工干预,提高物流资料档案的使用效率。

 

方案二:某物流公司无纸化清关方案

1、概要

1.1、用户背景

某物流集团公司在物流方面业务范围涵盖了现代第三方物流各环节的全部功能,是一家以进出口物流管理为核心业务的,整合保税和非保税仓储、海关报关、商检报检、国际和国内运输、进出口批文代理等供应链各环节的综合型物流管理公司。

由于海关推行无纸化报关,即要求报关单扫描后,将电子文档发送到海关指定系统进行报关,取代之前的纸质文件报关方式。

1.2、现状及需求

报关的纸质单据以A4幅面报关单为主,其中有些资料比较薄,有些打印颜色很淡,采用一体机扫描后字迹无法看清。操作人员需要先使用复印机加深复印后再扫描,浪费人力。

另一方面公司内部文件流转也是纸质文件,时效性较差,计划也更新为电子文件传送。

1.3、系统设计目标

通过图像优化软件结合先进的高速扫描仪扫描纸质的报关单,优化报关单的图像质量,取代原先所需的加深复印,提高扫描效率;

通过扫描识别软件扫描同时自动识别报关单上条码作为文件名保存,并以条码作为文档分割页。批量扫描自动分隔、自动以条码值命名保存,减少人工干预,节省人工成本,提高了录入效率。

2、解决方案

2.1、整体方案概述

根据用户的需求,推荐采用Kofax VRS + Kofax Express软件+富士通fi-6130Z扫描仪完成文档电子化操作。

富士通高速扫描仪fi-6130Z是高性价比的彩色双面文档图像扫描仪,具有高效、多功能和高可靠的特点。

Kofax VRS软件优化报关单的图像质量,取代原先所需的加深复印。

Kofax Express软件扫描同时自动识别报关单上条码作为文件名保存,并以条码作为文档分割页。

2.2、产品配置

序号 产品名称 功能描述

1 扫描仪fi-6130Z 高速扫描仪

2 Kofax VRS 优化报关单的图像质量

3 Kofax Express 扫描同时自动识别报关单上条码

3、实施成效

图像效果和扫描速度均能满足工作需求,简化原先工作流程,提高效率。

未使用VRS扫描的图像:

 

使用VRS优化后的图像:

 

 

方案三:存储典型方案应用

1、概要

随着物流行业的飞速发展,业务量也在急速增加,物流资料档案影像文件数据量增长迅速。

物流资料档案影像数据需要长期保存,系统要对影像文件进行备份,保证系统数据损坏后能够快速恢复;对业务发生达到一定时间,访问概率低的影像数据应当实现归档,以降低对生产存储的占用;当业务需要时,能够迅速地查询到已经归档的影像文件。然而,物流资料档案影像系统数据的文件小、数目多、总量大的特点,使得数据存储与数据保护存在诸多技术难点。

2、解决方案

元核分布式存储是一款赞华集团自主研发的分布式架构的存储系统,针对高存储IO要求、高并发和海量数据存储应用而设计,其强大的自主研发的分布式存储为用户提供一套高性能、高可靠、高扩展和低成本的数据存储环境。

 

2.1、聚合性能

元核分布式存储,采用完全分布式架构,没有单一的节点瓶颈,无需单独元数据节点的管理。

 

 数据直接读写,应用系统作为访问Client和后台存储节点直接通信,不需要代理和转发。Client不需要负责副本的复制(由primary负责),这降低了client的网络消耗。

 高并发度。Objects是分布在所有存储单元上。读写任务可以通过负载均衡的方式分发到多个存储节点上。

2.2、在线动态扩容

元核分布式存储软件完全支持在线动态扩容,节点自管理。整个系统易扩展、升级、替换。当组件发生故障时,自动进行数据的重新复制。当组件发生变化时(添加/删除),自动进行数据的重分布。

 

 

 

 性能、容量支持横向扩展提升

 系统升级、扩容支持在线进行

 合理系统堆叠可以得到无限性能和容量

 新增节点可以得到近似线性的增长

2.3、多样化数据存储保护模式

元核分布式存储系统有多种数据冗余方式。

 多副本方式。直接将文件对象存储多份,尽量分布在不同数据中心、不同的机房、不同的机柜、不同主机、不同对象存储服务上。来保证数据的可靠性。

 Erasure Code(EC)模式。指定数据块(K)和校验块(M)的个数,然后将文件拆分成K+M总数的数据对象进行存储。当且仅当丢了超过M个数据对象,数据才会丢失。

2.4、异地自动数据备份

元核分布式存储充分发挥对象存储的优势,非常有利于多数据中心异地数据容灾场景。同时,跨越多数据中心的场景下,仍有很好的整体数据一致性。对于跨地域维护统一的命名空间,元核分布式存储也更有优势。

 

2.5、多租户管理

元核分布式存储支持多租户管理,以及面向多业务系统的逻辑管理。同时,支持权限管理、版本管理等多功能的企业内容管理功能。

 

 

 

2.6、自动化运维

元核分布式存储,由于具有对象存储扁平化设计、高冗余度设计、高并发自管理设计等诸多整体系统健壮性的先天优势,使得元核分布式存储在运维方面复杂度方面也大大降低。

 

 自动向其它磁盘迁移保证数据均衡(快)

 计划性报修,定期集中处理。

 有足够多冗余服务,单个down无影响。

 非硬件故障能自动检测,自动修复。

 全程自动化,无服务中断

 只需要指定源和目标

 无需值守

 界面支持运维操作

 

中物联微信公众号