网站首页 互联网 科大讯飞摘得ICFHR 2020数学公式识别挑战赛冠军 正文

科大讯飞摘得ICFHR 2020数学公式识别挑战赛冠军

admin 2020/08/31 互联网 79℃

互联网资讯

[db:标签]到HKUST[db:标签]迅飞,人们总是谈论先进的智能语音技术,它“使机器能够听和说”。事实上,除此之外,HKUST迅飞的“狮子攻击者”也一直在努力制造“能够看见和识别”的机器。

最近,香港科技大学迅飞A.i .研究所与香港科技大学国家语音和语言信息处理工程实验室合作,以显著优势赢得ICFHR 2020 OffRaSHME数学公式识别挑战赛冠军。这是HKUST迅飞在获得ICPR 2018年MTWI图形识别挑战赛三项冠军和ICDAR 2019 CROHME数学公式识别挑战赛两项冠军后,在图像识别和理解复杂布局文件方面取得的又一项成就,再次展示了HKUST迅飞在相关领域的技术进步。

脱机手写数学公式识别列表(官方数据)

脱机手写数学公式识别列表(外源数据)

备注:“正确”表示公式识别的句子准确率。总和表示句子准确率

技术顶天,掌握图文识别“金字塔”级别难题“解

此脱机识别和手写数学表达式的运动,在整个公式中分别允许1和2个错误。数学公式识别挑战赛由ICF HR 2020(国际手写识别前沿会议)组织。参与团队包括韩国三星、东京A&M大学、华南理工大学、中山大学和其他研究机构,他们多年来一直致力于文档分析和理解。

与传统的图形识别相比,识别数学公式通常更加困难,在技术上也更具挑战性。这次业余比赛的正式任务是“离线手写数学公式识别”。与ICDAR 2019 CROHME的脱机手写公式识别任务相比,该任务的难度再次提升。有三个主要的困难:

公式结构复杂,尤其是各种结构的嵌套难以辨别的形近字符

XxZ010

2r

对于数学公式识别中最难的复杂结构嵌套问题,HKUST迅飞提出了本次比赛添加了很多非常规符号的组合容易和公式混淆,在复杂公式结构嵌套中具有更强的泛化能力。为了解决近形符号识别困难的问题,科大迅飞提出使用基于LaTeX,使用数学公式的树形结构表达,合理拆分和分解数学公式,使用这些公式训练LaTeX语言模型,最后使用语言模型增强符合上下文语义关联的合理数据。这种策略可以大大减轻识别近似符号的困难。

通过上述技术能力的综合应用,HKUST迅飞以显著优势获得了极其困难数学公式识别挑战赛的冠军,证明了其在数学公式识别领域的技术进步。在实际应用中,学生的作业存在布局结构复杂、写作风格差异大等难题。该系统将为他们提供更加丰富有效的解决方案。

通过综合运用各种技术能力,HKUST迅飞在“看和认”方面做得更好。不仅可以识别更复杂的数学公式,还可以识别“中国数学公式”混合搭配的内容,这将在以后的产品中得到应用。

不在数学公式识别组件内

建模的Encoder-Decoder识别算法基于树形结构信息建模的Encoder-Decoder识别算法基于

不在数学公式识别组件内

事实上,HKUST迅飞在图像和文本识别领域积累了多年的核心技术,拥有自己的知识产权。随着每一次技术迭代,产品都会大规模更新和升级,以更好地满足多种场景中用户的需求。

2015年,LaTeX语言模型的数据增强策略首次在手机设备上使用,在线手写字符识别任务取得突破性进展。得益于这项技术,应用立地用户的手写输入体验得到了显著改善。

2016年,打造成功应用于文本行识别任务。该系统不需要进行文本行分割等常规、复杂的布局分析,有效避免了分割带来的错误,使中英文手写文档在文本层面的识别效果达到了人工同等水平。依靠这项技术,HKUST迅飞智能辅助阅卷系统可以辅助阅卷中文作文、英文作文、英文翻译、数学填空、英文填空等各类试题。它已经在许多省市申请了全国高中入学考试,并且已经处理了超过1亿张的问题卡。

2018年,“能看会认”的0A.I.0产品0轻量级的0卷积神经网络讯飞输入法在自然场景字符识别任务上取得了非凡的成就。通过整合语言模型进行端到端训练,使模糊字符能够通过语言模型的“联想”得到正确识别。依靠这项技术,在CNN-HMM中,复杂场景中的各种字体可以一次翻译出来,使得照片的翻译更加清晰准确,满足了更多消费者在国外旅游和购物场景中的应用需求。

今年,数学公式识别任务的许多关键技术继续取得突破。框架基于注意力机制的Encoder-等产品也将应用相关核心技术,帮助用户准确分析大数据学习情况,发现知识点的薄弱环节,实现“个性化精准学习”,帮助学生提高学习效率,巩固学习效果。

在技术应用过程中,手写图文识别也与智能语音等关键技术深度融合,让大家感受到技术进步带来的效率和便利。例如,Decoder上的“文字自然出现,从纸上跃出”可以实现手写笔记的直接语音搜索和“在一句话中找到手写笔记”,满足用户在更多的笔记场景中进行记录、书写、搜索和多终端同步的需求,从而有效提高办公效率。

在未来的618年,会有更多的产品来满足你。你可以在零距离内进一步体验这些新技术。

21年来,HKUST坚持走人工智能的道路,不断攀登技术高峰,在智能语音、计算机视觉、自然语言理解等技术领域一个接一个地获得桂冠,但这并不是终点。HKUST迅飞将始终坚持“不屈不挠的精神”的技术信念,创造“能听、说、看、认、懂、想”的人工智能产品,用人工智能点燃世界的焰火。

模型网站的内容是从其他媒体转载的,目的是为了传递更多信息,这并不意味着本网站同意其观点。其原创性以及文本中所述的文本和内容未经本网站确认。我们对本文本、其全部或部分内容以及文本的真实性、完整性和及时性不做任何保证或承诺,请自行核实相关内容。本网站不承担此类作品侵权的直接和连带责任。如果本网站有任何内容侵犯您的权利,请及时与我们联系,本网站将在24小时内完成。

网站地图