专利名称:用于扫描图像中的表格信息的数据结构生成专利类型:发明专利
发明人:A·F·罗德瑞格兹,M·嘉芭拉尼,W·法尔鲁克申请号:CN202010405509.X申请日:20200514公开号:CN112131920A公开日:20201225
摘要:本申请涉及用于扫描图像中的表格信息的数据结构生成。提供了用于生成表示扫描图像中的表格信息的数据结构的计算机实现的方法。这样的方法可以包括:存储表示表格的扫描图像的图像数据;处理图像数据以识别图像中的字符和线的位置;以及根据所述位置映射信息单元格在图像中的位置,每个信息单元格包含一组字符。该方法还可以包括,对于每个单元格,根据单元格定位来确定用于预定义的单元格属性集的单元格属性值,并将该属性值作为输入提供给机器学习模型,该机器学习模型被训练为根据单元格属性值将单元格预分类为标题单元格或数据单元格。
申请人:国际商业机器公司
地址:美国纽约
国籍:US
代理机构:中国贸促会专利商标事务所有限公司
代理人:刘玉洁
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- huatuo0.com 版权所有 湘ICP备2023021991号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务