首页 » 互联通信 » 2023·聪慧法院篇 | 立异产品之“材料智能识别编目系统”

2023·聪慧法院篇 | 立异产品之“材料智能识别编目系统”

福州有家装饰工程通讯 2025-02-19 0

扫一扫用手机浏览

文章目录 [+]

作为装备展配套活动,法制日报社于今年3月连续举办了2023政法智能化培植创新案例及论文征集宣扬活动,活动征集了“聪慧管理”“聪慧法院”“聪慧检务”“聪慧警务”“聪慧法律”创新案例、方案、产品、论文,6月25日结果揭晓发布。
入选的各种创新案例、方案、产品、论文在7月10日至11日举办的成果展上进行了集中展示,并已编辑整理成册——《2023政法智能化培植创新案例及论文汇编》。

该汇编分为聪慧管理篇、聪慧法院篇、聪慧检务篇、聪慧警务篇、聪慧法律篇五个篇章,为政法信息化、智能化培植供应及时、准确、 实用的资讯信息与履历不雅观点。

2023·聪慧法院篇 | 立异产品之“材料智能识别编目系统” 2023·聪慧法院篇 | 立异产品之“材料智能识别编目系统” 互联通信

应广大读者哀求,我们特开辟专栏,分别将部分创新案例、创新方案、创新产品、创新论文进行展示,敬请关注!

2023·聪慧法院篇 | 立异产品之“材料智能识别编目系统” 2023·聪慧法院篇 | 立异产品之“材料智能识别编目系统” 互联通信
(图片来自网络侵删)

以下推出的是《聪慧法院篇 | 创新产品之“材料智能识别编目系统”》

材料智能识别编目系统

太极打算机株式会社

一、培植背景

自2016年起,全国各级公民法院相应最高公民法院干系辅导见地哀求,先后建成了电子卷宗随案天生系统,然而在电子卷宗天生的实际运用中,存在以下突出问题:法院案件电子卷宗材料来源多样,个中纸质材料在电子化处理过程中,因拍摄环境、手机翻拍角度、扫描条件及其他缘故原由造成图像质量有损,随意马虎涌现图像质量低下不易识别的情形,同时传统OCR识别技能受版面影响较大,识别后因版面还原效果不佳导致内容复制粘贴丢字错字等问题,而卷宗材料形式及类型的多样化,又进一步导致自动编目做事准确度低,给法官阅卷造成困难,间接降落了电子卷宗整体运用成效。

针对以上突出问题,太极股份创研了材料智能识别编目系统,旨在以海量文件智能深度运用为目标,基于大数据、机器学习、自然措辞理解等人工智能干系技能为法院行业供应图像质量检测、图文识别及版面还原、材料风雅化命名、智能编目、要素信息抽取等材料智能处理能力,帮助法院减少卷宗数字化加工人力本钱,同时盘活历史卷宗积淀,形成领域知识库,为智能知识做事供应支撑。

二、培植内容

1.图像质量检测

图像质量检测做事面向备案材料扫描职员、备案法官及布告员,在扫描图像处理上传、在线备案材料吸收等场景中自动对电子材料进行可读性检测,根据检测结果自动进行图像质量增强优化,支持提升清晰度、调度亮度、去除椒盐噪声、去除污点、去除黑边、去除装订孔、倾斜校正、自动识别空缺页等质量增强方法,并对低质图像自动预警,以提高图像品质。

2.图文识别及版面还原

线下、线上材料的手写及印刷体图文识别及版面还原做事,针对JPG,JPEG,PNG,TIF,PDF、BMP 等多种格式文件,图文混排等繁芜版面笔墨识别效果不佳问题,不断优化图文分离、繁芜版面文本行识别、表格版面构造预测等繁芜版面剖析重修算法,精准复原文本段落、层级(编号)、缩进等内容组织关系,并对字体大小进行复原,高精度识别并复原标题、表格、图像、下划线等紧张的版面特色,终极实现对电子图像在繁芜背景、图文混排、表格版面等情形下的印刷体、手写体笔墨精准识别、版面还原,最大限度提高笔墨内容识别和复制的精准度,办理法院案件电子卷宗笔墨识别精度低、识别结果不易直策应用等问题,有利于提升法院案件办理效率与管理水平。

3.卷宗材料风雅化命名及智能编目

卷宗材料风雅化命名及智能编目做事面向备案法官、布告员等岗位需求,在备案、审理、归档等多个业务场景中,供应基于法标标准阅卷、归档编目规范的自适应分类编目做事,以及面向不同地方法院差异化编目需求的个性化配置,办理人工编目、校验效率低,自动做事难以知足个性化编目习气等问题,从而提升法院案件办理效率与管理水平。

卷宗智能编目做事支持与本地法院接口集成、页面集成、API集成等办法,批量导入待编目的电子材料,对卷宗材料图像进行分类、完全性识别,并天生阅卷目录树,并支持对卷宗当事人***明材料和主要证据材料进行风雅化命名,包括但不限于:***、业务执照、状师执业证、授权委托书、传票、投递回证、起诉状、上诉书、裁定书、讯断书等。

4.案件要素抽取

面向备案、审理、文书编写等多个业务场景,供应刑事、民事、行政、实行等常见案件类型卷宗材料要素信息自动抽取、文本内容知识化处理做事,支持对立案审批表、起诉状、上诉状、庭审笔录、合议笔录、讯断书、裁定书等紧张案卷文书进行构造化处理和不低于20项的要素信息抽取,支持对全卷宗材料要素抽取信息来源标识和抽取信息差异提醒。

案件要素抽取做事支持与本地法院卷宗系统或者卷宗库接口集成、页面集成、API集成,批量导入全卷卷宗或者待抽取材料。
可从上传的卷宗文件文本中抽取案件基本信息,并对不同材料来源的同一要素信息对齐领悟。
从而办理办案职员在多个业务环节需手动录入大量信息,影响办案效率的问题,为备案结案信息回填、类案推送、要素式文诗人成等知识做事场景供应案件根本数据支撑。

针对信用卡轇轕、金融借款等常规案由,在案件基本信息提取的根本上还可定制化案情特色要素信息抽取。

三、上风亮点

(一)图像质量检测

l 基于图像质量检测打算结果,自动区分图像品质(高/中/低)。

l 图像低质量预警。

l 根据配置实现图像自动优化。

l 批量图片一键优化。

l 多种图像质量增强方法:提升清晰度、调度亮度、去除图像噪点、去除污点、去除黑边、去除装订孔、倾斜校正、肃清形变、还原A4比例、识别空缺页等。

l 支持自动优化和人机交互两种图像后处理办法。

(二)图文识别及版面还原

l 繁芜版面剖析能力:多样式表格、倾斜、印章、图文混排等。

l 图文识别能力,支持印刷体识别准确率不低于98%。

l 支持GPU和国产化加速卡适配。

l 能够对超过10M 的图像文件进行优化处理。

l 支持措辞识别,包括简繁中文、英文及常见标点。
(可识别笔墨支持覆盖GB2312 编码内中文、英文及常见标点符号,对付《中华公民共和国国家通用措辞笔墨法》的配套规范字集《通用规范汉字表》)。

(三)卷宗材料风雅化命名及智能编目

l 领悟图像分类、文件标题识别、文本语义分类等多种识别技能,对案件卷宗内当事人***明材料和主要证据材料进行要素信息识别、提取,材料类型快速精准识别。

l 基于提取的要素信息和命名规则进行材料风雅化命名,支持对不同材料提取要素、命名规则的定制化配置。

l 法官阅卷目录、档案归档目录自动切换,支持法院行业标准FYB/T 52021-2018《电子卷宗阅卷目录规范》、《归档目录规范》。

l 支持刑事、民事、行政、实行、信访申说等多种案件卷宗材料自动编目。

l 支持材料完全性识别。

l 支持个性化目录定义。

l 支持阅卷目录、归档目录自动切换,及目录构造信息导出。

(四)案件要素抽取做事

l 基于平台能力可快速定制个性化信息抽取做事

l 支持对刑事、民事、行政、实行等常见案件类型的卷宗材料基本要素抽取,基本要素不低于20项。
支持对立案审批表、起诉状、上诉状、庭审笔录、合议笔录、讯断书、裁定书等紧张案卷文书进行构造化处理和要素信息抽取

l 支持对全卷宗材料进行要素信息抽取、对齐、领悟

l 支持多源材料抽取信息差异提醒

l 支持要素抽取信息来源标识

四、运用成效

材料智能识别编目系统基于图文识别引擎、智能编目引擎、卷宗知识引擎三大智能引擎,为海量文本格式化、知识化处理供应主要的支撑,从而提升法院卷宗深度运用能力。

1.图像质量检测方面,自动对电子材料进行可读性检测,基于检测结果,对低质图像自动预警,供应自动优化和人机交互两种办法进行图像质量后处理,以提高图像品质。

2.图文识别及版面还原方面,在手写体识别精确率以及识别效率上表现优胜,同时可以将识别结果最大程度进行版面还原,提升内容复制准确率。

3.智能编目方面,基于行业编目规范,结合图像目标识别、图像分类、语义相似度打算等技能对电子材料快速精准识别命名,支持首页识别、阅卷/归档目录自动切换、目录树导出等做事,材料类型识别均匀准确率不低于90%,有效提升法院电子卷宗天生效率和卷宗可管理性、可阅读性。

4.要素信息抽取方面,经由要素多源信息对齐,核验、领悟算法,获取要素本体信息,进一步可构建卷宗知识库,为案件回填、类案推送、案例研判、智能检索、要素式文诗人成等知识化做事场景供应全面技能支撑。

标签:

相关文章