赛题名称:文化传承

2019-07-31 02:12
软件和集成电路 2019年5期
关键词:赛题参赛者准确率

赛题背景

书法是汉字的书写艺术,是中华民族对人类审美的伟大贡献。从古至今,有大量照亮书法艺术星空的经典之作,是中华文明历经漫长岁月留下的艺术精华。

这些书法作品现在仍以各种形式呈现给世人:博物馆里的字画作品、旅游景点里的碑刻、建筑上的题词、对联、牌匾,甚至寻常家居里也会悬挂带有书法艺术的字画。在全球化、电子化的今天,书法的外部环境有了非常微妙的变化,对于年轻一代,古代书法字体越来越难以识别,一些由这些书法文字承载的传统文化无法顺利传承。所以利用先进的技术,实时、准确、自动地识别出这些书法文字,对于记录整理书法艺术和传播书法背后的中国文化有着重要的社会价值。

利用人工智能技术,现在的中文识别已经有了很大的突破和极高的准确率。但是对于各种真实场景下(比如国画背景、建筑背景)的非楷书书法识别效果不佳。本次大赛希望征集到优秀的、有创意的AI算法,解决这个问题。

任务描述

书法是中华民族文化传承的瑰宝,希望此次大赛能够通过人工智能算法实现书法文字的自动识别,解决实际场景中有些书法文字难以识别的问题,要求参赛者给出测试数据集中每张图片中文字的位置及对应的内容。

本次大赛会提供已标注的训练图片集供参赛者开发、训练、生成模型和算法,参赛者用开发和训练生成的模型和算法,识别测试图片集中每张图片书法文字的内容以及文字对应的位置并提交競赛平台,以参赛者提交的结果准确率作为竞赛排名成绩的依据。

赛题内容和方向

这套赛题完全是将传统文化与人工智能接轨,华为云为所有参赛者提供已标注的训练图片集,参赛者则被推荐应用华为云一站式AI开发平台ModelArts开发训练生成特定的模型和算法,并凭借这些模型和算法识别测试图片中书法文字的内容及位置,最终以参赛者提交的结果准确率作为评判成绩的标准。

赛题价值

作为汉字的书写艺术,书法是中华民族对人类审美的伟大贡献。在全球化、电子化的今天,对于中国新生代而言,散布在各种场景间的古代书法字体越来越难以识别,一些由这些书法文字承载的传统文化无法顺利传承。针对这个问题,作为本次大赛的出题方之一,华为云EI(企业智能)为准确、自动地识别出辨识度较低的书法文字,以便记录整理书法艺术和传播书法背后的中国文化的重要社会价值。本赛题聚焦人工智能方向,基于各种真实场景下(如国画背景、建筑背景)的非楷书书法的图片标注,华为云鼓励参赛者利用人工智能技术,给出测试数据集中每张图片中文字的位置及对应内容,达到精准的识别。

赛题难点

1.赛题数据为模拟古文写作风格生成的书法类型的图片,基本是按照文字竖列标注的。让参赛者在领略传统中国文化的同时系统地应用AI技术。传统的检测和识别方法可能很难达到较高的准确率,建议采用深度学习技术。

2.其中赛题可以分为两部分,文字检测和文字识别。文字是物体的一种,所以文字检测本质上属于物体检测的特殊情况。物体检测是近年来人工智能的研究热点,参赛者可以参考通用物体检测方法,也可以使用近年来针对文字专门优化的检测算法。文字识别则既可以通过简单的物体分类算法,也可以使用近年来发表的专门识别文字切片的算法。

3.赛题评判标准为文字字段识别F1值,即参赛者需要同时保证字段识别结果的precision和recall。字符和字段的precision和recall基本成正相关,故而不再单独考虑字符识别结果F1。文字检测结果的precision和recall则间接影响了识别结果,即间接影响了最终得分和排名。

猜你喜欢
赛题参赛者准确率
一道竞赛试题的多角度探索
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
记一种美丽
劝退马拉松参赛者
害我受伤的小石头
谈谈备赛“湖南省高职高专实用英语口语大赛”
用整数的一个简单性质巧解赛题