采用硬件和软件一体化的架构,建设一套智能识别外事证件和文件的系统,实现外事证照关键信息的采集和录入。 识别的外事证照包括:公务普通护照、因公赴港澳通行证、因私护照、因私赴港澳通行证(卡片)、各个国家的护照信息识别(160个国家)、外国颁发的商务签证(美国、日本、法国、德国、英国、加拿大、韩国、瑞士、瑞典等10个国家)、工作许可通知、工作许可证。
基于OCR智能识别技术,公司能够有效简化业务流程,替代部分人工审核,有效抵御合规风险;能够增效降本,提升工作效率,降低运营成本;能够改善用户体验,业务流程的自动化、免去繁琐人工录入信息。从长远规划考虑,决定建立公司级的统一的OCR智能识别平台,以此增效降本和规范管理。
-
OCR技术精准识别
OCR护照识别技术高效、准确、集成方便、灵活和安全,提供了可靠、安全、高效的证照信息管理方案。 采用了最先进的算法和模式识别技术,能够准确、快速地识别护照上的各种信息,并能够应对各种复杂的护照类型,极大地提升了证照信息收录的效率和准确性,有效减少了人工干预和误差,为证照管理的业务发展提供了有力的技术支持,同时,该技术还注重保护个人隐私和信息安全,确保护照信息的安全性。 。
-
可扩展性
将识别需求分为固定版式、半固定版式和非固定版式。 固定版式无需训练,无需定制化开发;通过上传识别模板图片,框选定位锚点,框选识别字段完成模板制作。自定义模板基于通用OCR和多模态结构化双擎技术,实现了OCR场景识别的快速适配,能够有效应对版式倾斜、跨页流水、换行和行列变化等情况。 半固定版式用于应对复杂版式,通过平台自训练工具,利用数据增强技术完成小样本学习。标注人员只需要标注少量样本,制作对应的结构化模板;平台调用智能标注服务自动化标注数据,通过人工审核确定标注数据;数据增强技术模拟不同光照、倾斜程度等环境,自动合成训练数据,增强模型精度和泛化性。 非固定版式版式相对复杂,无法通过模板识别。针对此场景,OCR平台通过NLP语义理解后处理,结合字段抽取规则引擎和版式分析引擎达到文档要素抽取的目的。用户可自定义新增字段,90%以上的场景无需训练,大大提高工作效率,避免人工操作误差。
-
能力延伸性
智能识别平台要充分发挥价值,需要多层能力叠加。第一层是基础性能力,比如证照的各要素识别;这一层能力是后续所有延伸能力的必要保障。第二层是高阶能力,需要结合业务场景,充分探索。
-
微服务架构
基于K8S的微服务架构:OCR智能识别平台基于K8S的微服务架构,将不同的子系统拆分成独立的微服务,并通过K8S内部网络进行通信和协作。降低系统的复杂度和延迟,提高了系统的可维护性和可扩展性。 规则引擎:OCR识别结合规则引擎,可以灵活配置审核条件,实时地提取和分析业务数据,自动化地处理合规审查等问题,减少人工干预,进一步提升处理效率和准确度,帮助客户更好地管理风险。