在最近被ECCV2020接收的论文AutoSTR中,第四范式的研究人員提出了使用网络结构搜索技术来自动化设计文本识别网络中的特征序列提取器,以提升文本识别任务的性能。由于文本的多样性和场景的复杂性,通过对图像预处理模块(如校正和去模糊)或特征序列翻译模块的改进,提高文本识别网络的性能越来越受到各方关注。
研究团队提出以AutoSTR来搜索数据相关的主干网络。他们为STR设计了一个特定领域的搜索空间,既包含了操作上的选择,也包含了对下采样路径的约束。通过一个两步搜索算法将操作和下采样路径分离,以在给定的空间内进行有效的搜索。实验表明,通过搜索数据相关的主干网络,AutoSTR可以在标准基准测试中优于其他SOTA方法。