关注官方微信
天天315消费维权
近几年,大模型与光学字符识别(OCR)技术的结合已在医疗、教育等诸多领域得到普遍应用,越来越多的企业开始尝试采用自主研发或定制开发文档信息抽取模型的方式,为各行各业提供个性化的文档管理和数据分析解决方案。
最近落幕的中国图象图形大会(CCIG 2023)上,技术论坛《文档图像智能分析与处理》成为亮点。合合信息智能技术平台事业部副总经理、高级工程师丁凯博士出席该论坛,对公司在人工智能及OCR领域的突破及产品的应用情况进行了介绍分享。
丁凯博士
智能图像处理技术是合合信息智能文字识别技术的重要组成。据丁凯博士介绍,针对传统识别技术遗留的问题,合合信息通过ROI提取、干扰去除、形变矫正、图像恢复以及图像增强这一整体技术的提升,解决文档进行智能扫描与识别分析中出现的图像弯曲矫正、摩尔纹、反光问题,大幅提升了图像质量。
此外,合合信息持续突破版面分析技术在版面分割、区域间的逻辑关系处理等方面的难题,通过智能文字识别、智能图像处理等核心技术,可将文档图像划分成为不同类型内容的区域,从而确定文档中的文字位置、字体、大小和排版方式,实现版面的分析和还原以便精准获取信息。
合合信息是一家人工智能及大数据科技企业,从创建之初就拥有AI技术先发优势,早在十多年前就开始为AI技术探索更广阔的道路。据悉,合合信息目前已成功搭建了包括名片全能王、扫描全能王、启信宝在内的C端产品生态矩阵,并将多项尖端智能图像处理技术应用于扫描全能王等产品中,图像安全领域中的篡改检测技术也已被银行、保险、制造业等多个行业引入。
同时,合合信息还推出了TextIn Studio智能文字识别训练平台,可将底层资源、数据、模型训练、集成部署和服务管理应用多个模块整合在一起,针对性解决不同业务中存在的文档版式繁杂、训练样本匮乏、模型定制化调优周期长且效率低等问题,建立业务流程之间的闭环,实现模型自动化训练和部署。
未来,合合信息将持续为全球用户带来更多智能化的优质产品及服务,促进AI技术在文档处理领域的应用落地。