摘要:信息技术的快速发展,传统纸质笔记已无法满足现代用户之需,大众更倾向于使用数字化工具来记录和管理信息,打造一款可以载入用户个人手写字体的笔记App,通过笔记App可以便携的记录工作和学习中的众多要点,提升学习工作效率,并实现纸质笔记的电子体验感,打造属于用户个人的知识笔记。基于字体识别技术,分析字体识别技术在笔记App中的应用性,结合笔记App的发展现状,总结归纳出给予字体识别技术的笔记App的设计策略,并对笔记App的功能及界面开展设计实践。从笔记App的产品定位、功能设置、视觉设计等方面,逐步完善设计实践。该设计策略可满足用户的各项使用需求,给用户带来愉悦的使用体验。
关键词:字体识别;笔记App;界面设计;手写字体;视觉设计
中图分类号:TB472 文献标识码:A
文章编号:1003-0069(2024)23-0140-05
引言
笔记,类似“大脑”的延伸,记录生活之点滴,重要知识点亦或是转瞬即逝的灵感,均可以通过电子笔记的形式被永久保存。相较纸笔,笔记App 更轻,适用范围更广,传统的纸质笔记,受限纸张之限,有损坏之险,笔记App 软件内的云端存储则可提供数据安全保障[1]。
数字化时代,可以觉察“无纸化办公”的观念逐渐蔓延,传统纸质笔记记录到一定程度,快速查找和存储成为棘手难题。开展基于手写字体识别技术的笔记App 设计探究,让用户在使用电子笔记时拥有实体纸笔书写的体验,提供便利知识记录服务,促进电子笔记发展,宣传“无纸化”低碳环保理念,为字体识别技术和笔记类App 产品设计的发展提供新方向。
一、笔记App背景概述及研究现状
(一)介质承载与机器训练:手写字体识别技术概述
信息化浪潮席卷与人工智能技术日益成熟,文字识别技术逐渐走进大众视野,文字识别领域涵盖印刷体字符识别与手写字体识别两大类,现阶段印刷字体识别技术已取得显著进步,在多个领域,如车牌识别、快递单号识别等方向得到广泛应用,极大简化日常文字输入与检测流程。手写字体识别技术发展相对迟缓,原因在于每个人的书写习惯有所差异,字体样本识别难度高于印刷体,手写字体识别的模型通常需经过大量的样本训练,数据收集难度大。随着深度学习技术不断发展,卷积神经网络(Convolutional Neural Networks,CNN)作为主流网络架构,在目标检测、图像分类等研究领域表现突出[2]。目前,在OCR 中采用深度学习方法的研究主要集中于文本区域定位,比如采用Faster R-CNN、Yolo 等模型进行自然场景的文字区域提取与识别,自然场景下达到85% 左右的文本检测率[3]。通过引入GoogLeNet 深度卷积模型,也能够有效地提取字体多尺度特征[4],此类研究的出现提高了识别的利用率和准确性。
融入“现代神经网络”的字体识别技术,不仅使识别的精度大幅度提升,同时为应对字库庞大导致的训练复杂问题,通过“笔画匹配”(笔画特征提取和笔画结构与匹配)的方式实现“高精度化”的汉字识别技术。字体识别技术的进步也使得大量笔记App 中也嵌入了相似的功能,让用户可以更便捷地在文档中迅速加入大量需要的内容,不再是需要自行输入或是插入图片,提高了笔记软件的功能性和便捷性,通过笔画匹配实现的汉字识别技术不仅提高“识别准确度”(字体),通过引入基于VDSR 超像素神经网络的方法,也让用户可以在笔记App 中查阅自己的手写字体,给用户带来实体笔记的体验,用户的手写“笔迹载入”可以保护用户的知识产权,防止个人内容被泄露。
(二)多元之需与记录协同:笔记类App 的现状
笔记App 是以智能手机为载体,为用户提供随时随地进行记录的应用软件,改变了传统的笔记方式,突破空间与用具的限制,降低了时间和经济成本,获得便携的存储与分享,有效提升用户工作、学习效率。应用市场中的笔记App 多达数百种,例如有道云笔记、印象笔记、锤子便签等(如图1),笔记App 按功能设计上主要分为小而精和大且全两类。
在“小而精”功能设计上,此类笔记App 专注解决单一痛点问题,如锤子便签(如图2)其出色的备忘录功能,帮助用户轻松记录生活中的点滴;吾记(如图3)则专注于日记功能,为用户提供了一个私密、安全的记录空间。这些产品多为单机应用或互联网功能常被人们忽略,这类产品也存在着一定的弊端,如用户黏性差,用户转移几乎不耗成本,然而这些专注解决“单一痛点”问题的笔记App 往往在各自领域内深耕,凭借专业和精细的功能设计,逐渐成为“大且全”这类笔记App 始终无法替代的存在。
在“大且全”的功能设计上,此类笔记App 其功能涵盖日常生活多维度的“适用场景”,如印象笔记(如图4)、有道云笔记(如图5),工作中能够轻松地进行会议记录、多人协作等,在学习中用户可以利用记录课堂笔记、整理学习资料等,在日常生活中也可以用于记录生活点滴、制订旅行计划等,这类应用支持多端的云端存储服务,保护用户的文件不被遗失,同“小而精”类型的笔记App 相比,他们在每个功能区域都不够深化,用户在针对性使用功能时没有良好的使用体验,在应用场景方面此类产品也是“小而精”类笔记App无法比拟的。
二、基于手写字体识别技术的笔记App的创新设计策略
用户使用笔记App 的基本需求是“快速存储”和“高效获取”。首先,满足用户在不同场景下的功能性需求,针对功能进行细化,其次,探索技术与笔记产品结合创新,建立实体与电子笔记的连接以及如何为笔记App 添加社交属性,促进知识的传播和创新,最后,在视觉上做到简洁明了,降低用户使用负担。最后,从以下5 个层次对基于字体识别技术的笔记App 设计策略进行阐述。(如图6)
(一)场景多维化:满足复杂差异的使用需求
用户使用笔记App 的本质是快速处理“差异化场景”下获取的信息,在设计时应注意笔记App 不同场景的适应性,如学习生活中出现新的灵感需要快速的记录下来;参加会议时快速记录会议要点;旅行购物前列出计划或清单等,所以笔记App 需要提供适应不同场景的记录功能,支持多种文本格式,图片、音频等多种媒体形式的导入。笔记的记录是为了在需要时便于查看,如果只记录不查看,笔记也就失去了意义,因此在满足各种场景使用需求的前提下,优秀的笔记管理模式可以让用户更好地使用。
(二)垂直细分化:精准导向的梳理功能构建
垂直细分的精准功能能够攫取黏性用户。用户在使用笔记App时常会因为产品功能不全面而放弃原有产品,同时,“单一维度”的使用性需求、“时效导向”的精准化需求,也促使着用户会选择具备这一“显著功能”的App 产品。以思维导图功能为例,这是用户使用此类产品时“关注度”最高的内容,思维导图能够帮助用户更清晰地梳理思路、整理信息,然而,大量笔记App 的思维导图功能构建过程繁琐,极大影响了用户的使用体验,导致用户的流失,除了思维导图功能外,笔记分类、标签管理、同步备份等功能也是用户在使用过程中“讨论频率”和“使用频率”较高的模块,通过细化完善这些功能,笔记App 可以更好地满足用户的多样化需求,提升用户黏性。
(三)技术融合化:识别技术与智能产品结合
字体识别技术在笔记App 的应用带来了诸多的便利,例如用户可以把大篇幅的文档通过照片或扫描的形式转换为可编辑的文本;语音识别与字体识别的结合让用户可以通过录音转换成文字,随着字体识别技术的不断发展,基于VDSR 超像素神经网络的方法可以对用户的手写字体进行识别分析,通过总结汉字中的常用笔画,与已有汉字字体库进行对比并提取用户各种笔画的书写方式进行字体生成,为用户建立个性化的手写字体数据库,让自己的字迹在电子世界留下专属于自己的印记。
(四)用户集群化:社群建构与互动平台交流
社群作为用户交流互动的平台,创建有良好学术氛围的社群,有助于推动知识深度内化。在社群中可以互相分享用户个人制作的笔记以及个人字迹,用户基于获取各自所需的“回报”而与其他用户进行互动,知识分享者主动并积极地传递知识,而知识接收者则需要为分享者提供一定的物质或情感上的“回报”,双方在一个充满互惠与信任的学术环境中进行知识的交换,为用户提供了一个良好的学习和交流场所。
(五)视觉规范化:风格简洁与界面合理构成
在产品的视觉规范上,应将知识类App 的“文化规则性”和“视觉规整性”相凸显结合,知识脉络的清晰整体和视觉美学的“清晰整体”应一体化。在调研过程中发现,大量笔记App 的界面设计中,部分产品追求图标风格统一,彰显设计感,一部分追求识别性,但缺少对于细节的把控,整体性不强[5]。在界面布局方面,大多数应用选择使用卡片式、宫格式或列表式的设计,此类设计方便用户在不同笔记之间快速切换,但是一部分功能的模块间存在明显的割裂感,功能的主次关系不够明确。为改善用户使用体验,文字选择醒目识别度高的无衬线字体,提高阅读性,在色彩上选用简单的颜色,降低用户对复杂颜色的视觉疲劳,在设计语言表达上,需要采取简洁、清晰、高效的设计原则,以降低使用过程中的视觉燥点,以提高用户的学习专注度[6]。
三、基于手写字体识别技术的笔记App设计实践
数字媒体时代,普罗大众面对海量信息、知识数据,使得人们学习工作面临信息过载、知识碎片化、知识保护等问题,笔记App 的出现让人们快速转化、重组信息资源,随时随地对碎片化知识整合和记录,完善个人知识库。
(一)“笔记”产品定位与生活场景覆盖
本产品是一款可以载入用户个人手写字体的笔记类App,涵盖日常生活的广泛场景,用户在使用笔记App 时主要有记录、管理、查看3 种基本操作,在满足用户多场景使用需求的前提下,细构并扩展各项功能,例如:建立良好的分享社群,方便用户获取更多的知识内容、融入手写字体识别技术,并为用户建立属于用户个人的手写字体库,提高用户的使用兴趣为用户的知识产权内容保驾护航。
(二)手写字体识别技术的介入与逻辑
1. 以汉字笔画为基础的字体识别技术。随着科学技术的发展,基于深度神经网络的汉字识别技术可以自动抽取语句中的“语义特征”,提升“识别精度”并抵抗外界环境干扰。但多分类的识别方式导致计算成本高昂,且模型扩展困难,基于笔画结构的汉字识别方法,结合风格转换应对字体变化,从而减少字体数据库录入的麻烦。
依据济南大学束健等人提出的基于“笔画分割”的多汉字字体识别技术[7],通过引入基于VDSR 超像素神经网络的方法,有效预测像素间的路径关系,优化汉字骨架图像的生成过程,对细化后的汉字骨架图像进行交叉点集合的求解,并采用8 邻域的模糊处理方式来消除这些交叉点。创新的字体识别技术既保证了模型在预测笔画数量时的准确性,又显著降低了模型预测的时间复杂度,提高了整体性能,解决了现有字体识别方法中由于扩展字库造成的重复训练问题,通过提取汉字图像中基本的笔画结构来实现基于笔画的汉字匹配识别。
2. 字体识别方法及底层原理。用户上传字迹图片时,为提高识别率,首先对文字的图像进行处理,对每个文字进行标记并获得所有文字的“待选区域”,对所选区域的文字进行风格转换,将其转换为标准的楷体汉字,更精确地提取笔画信息。对转换后的数据进行二值化处理,并将处理后的结果输入到笔画分割提取网络中,以提取单个字符的所有笔画分段结果。对获得的预测结果进行预处理,通过连通域划分的方式确定最大的区域,计算图像之间的IoU(交并比)比值进行最终笔画段的合并。将识别结果按照预设的笔画段类型送入数据库中进行对比识别,实现对图像中字符笔画的准确识别和分类,识别成功后将标记文字送入字体生成模型中,基于用户字迹对模型进行训练学习从而产出用户的手写字体。(如图7)
(三)笔记App 功能设置与模块设计细分
“笔迹”根据笔记类App 的使用需求上主要分为记录、管理、查看、分享4 个大功能,在App 内部又分为首页、文件库、新建笔记、发现和我的五大基本板块,五大模块逐层递进,功能结构细分明确,以达到准确的工具分类和使用的便捷性。(如图8)
1. 直抒胸臆与功能划分:“首页开端”板块设计。首页板块设计上采取“直抒胸臆”的形式,给用户以直观的视觉模块划分,功能划分上立足于需求和便捷导向。涵盖“搜索”“功能卡片”“笔记栏”3 个基本功能框架,“搜索”栏用户可快速找到想要查看或使用的笔记,搜索栏下方的功能卡片中设立3 个可横向滑动的页面,作用在于方便用户处在“快速使用”功能场景下,可更为便捷快速打开。第3 个页面的最后放置“功能自定义”功能,用户根据自己的喜好和需求,修改各项功能处在的页面位置。“笔记栏”会显示最近编写的笔记,每一篇笔记以卡片的形式显示在页面中,在每个卡片右侧用户,可以为“关键笔记”添加“提醒”和“标记”,用户在“提醒”中设定时间提醒时,会通过手机通知的方式提醒用户,设置“标记”笔记会置顶在笔记栏中,方便快速编辑查看。用户可通过“全部笔记”的小三角按钮处,自定义修改笔记栏中笔记的显示方式,例如,显示摘要、列表视图、按日期分组等,让产品更加人性化和便捷。在“任务中心”中为用户搭建成就系统,为用户提供相应的“回报”奖励,以促进用户的活跃度,例如,在用户连续使用时间达到一定时间时给予“学童”“学霸”等成就称号,加强用户持续使用。
2. 知识图谱与海量存储:“文件库”板块设计。“文件库”设计上,建立其用户与产品中的一套“桥梁星图”,以海量存储和笔记整理去梳理知识脉络。板块中“选择”“知识星图”“云端”“笔记本”功能可以对用户编写的笔记进行整理,用户通过右上角“选择”功能对每个笔记和笔记本进行重命名、删除、移动、加密等操作,生成的同时会在笔记本内自动生成智能目录,更加直观了解笔记本内各个笔记的关联和总体特征,对于未加入笔记本内的笔记,页面右上角“知识星图”功能中可以进行多个笔记之间、笔记与笔记本之间知识星图的创建和查看,构建用户个人的知识图谱。对于用户对每个界面不同的需求的问题,采取了与首页一致的自定义修改显示方式的功能,方便用户的浏览。“云端”功能可以让用户同步不同端之间的文件,也可以将文件上传至云端保护用户的文件安全。
3. 误触操作与协作形式:“新建界面”板块设计。“新建界面”是用户在使用产品过程中频率最高的功能(界面),为避免用户查看笔记过程中误触,导致笔记内容修改,将笔记界面分为了浏览和编辑两种状态。页面处在在浏览状态时,用户不能编辑笔记并在右下角出现编辑按钮,点击按钮才可以进入编辑状态,关闭键盘时进入浏览状态不可对文档修改。“上一步”在用户编辑出现错误时帮助用户退回上一步的操作如果误触“分享”功能可以让用户将笔记分享给其他用户查看或编辑,在分享时可以选择生成笔记二维码。在有需要多人一起创作笔记的场景下可以使用“协作”功能,创建在线笔记并邀请其他用户一起加入到笔记的创作中。除了这些功能外,在进行文本编辑时键盘框上方会出现辅助工具框,辅助工具框中包含了多种编辑工具如“个人字迹”“样式调整”“插入图片”“AI 助理”等,为更好地满足用户的使用需求,辅助工具框会根据用户当前的操作和文档内容智能推荐相关的编辑工具,为提高用户的使用体验,用户可以通过拖拽辅助工具框来调整辅助工具框的位置和展示方式。
4. 集市社群与激励机制:“发现”板块设计。“发现”板块建构共享的集市社群,设计联动的激励机制,包含“赞和收藏”“朋友”“笔迹集市”“消息”“笔迹圈”等功能。用户可以在“笔迹圈”内对公开的笔记进行点赞、评论、收藏,让用户接触到不同行业内的笔记作品,扩展自己的知识面提高自身能力。也可在“笔迹圈”内分享自己或获取其他用户基于“报酬激励”机制公开的笔记。“朋友”和“消息”功能的出现让用户在“笔迹圈”内能够找到自己志趣相投的朋友(如图9 所示),与朋友实时沟通互动,共同分享创作的喜悦,探讨心得体会,创建和谐共生的社区环境。“笔迹集市”中涵盖了个人字迹、模版、在线书城栏目,在内部为用户提供了大量可选择的笔记模版,用户可以在编辑笔记时按需查找使用,用户在使用App 内的字迹功能时也可以在“笔迹集市”中获取其他用户发布的个人字迹或App提供的书法字迹,丰富用户的笔记内容,在线书城的出现满足了用户的阅读需求,让用户可以在线获取、阅读电子书籍。
(三)笔记App 的典型设计特征及视觉呈现
1. 产品形式特征:用户书写捕捉与个性设计标注。在功能创新和形式上,将用户“书写笔记”和“随笔记录”作为一种实时捕捉,独树一帜的笔迹形成“历史性”标记和“知识性”沿袭的显著烙印,提升用户黏性和趣味性。笔迹可以看作一种独特的视觉形象,是肉眼能够直接捕捉到的书写具体表现,绝非抽象或虚幻的概念,笔迹具备个人特性,这种差异化恰恰体现在每一个字迹和笔画之中,构成了每个人笔迹形象的独特体系。通过将每个人的个人笔迹载入到笔记App 中,让用户使用笔记App 时可以选择使用自己的笔迹来书写,让书写者的个性和情感在电子世界中得以延续和传承。用户可以通过笔迹集市分享个人字迹来换取相对应的报酬,用所得报酬来获取其他用户的个人字迹或笔记模板,用不同的笔迹或模板不断丰富笔记的创作内容,让笔记的创作更有趣味性,在电子世界中留下属于自己的个性语言。
2. 界面交互特征:模式切换有序和布局简洁明了。唐纳德·诺曼在其著作《设计心理学》指出“设计一个有效的界面,不论是计算机或门把手,都必须始于分析一个人想要做什么,而不是始于有关屏幕应该显示什么‘某种隐喻’或者观念”。笔记类App 大多在视觉风格(交互流程)上呈现多元化,这无形中为增添了用户的认知负担,通过对交互模式进行优化,以最少的操作步骤达到想要的效果让用户可以轻松实现各种操作,重新布局界面元素,注重营造井然有序的美感,在界面布局上采用了底部标签式导航,保证用户可以在各个板块直接进行切换,为增强用户的视觉焦点,当前正在使用的板块在导航栏会高亮显示,可以快速辨别所处的功能区域,为用户编辑方便“新建笔记”会一直成高亮状态,保证用户可以随时随地进入笔记的创作,每个板块中默认采用列表式布局的方式,使得每个功能模块划分清晰明了,用户也可以根据个人使用习惯进行布局排列的自定义。
3. 色彩美学特征:沉浸书写体验和直观视觉识别。在笔记和知识类App 设计的美学特征和上,应建构一种直观的视觉导向,以明确、扁平、简化为设计规则,消解复杂的流程和视觉观感,优化色彩饱和和降低视觉疲劳,提升用户的使用频率和积极性。App 产品命名为“笔迹”,笔迹基本含义指的是字迹、字体的样子,是个人书写风格的独特体现,在“笔迹”的启动图标设计上,采用了手写书法字体来书写“笔迹”这个名称,底部选取实体纸张的纹理颜色,给予用户真实书写的感受(如图10 所示)。“笔迹”App 的功能图标基于用户视觉认知,通过拟物化设计和扁平化风格并采取简洁明了的图形设计,具有直观的识别性,在色彩上采用黑色和黄色的组合进行设计,黑色代表沉稳与内敛,黄色则象征着活泼与奔放,这种色彩搭配具有强烈的视觉冲击力,给用户以活泼奔放之感,同时有内敛与沉稳之韵。字体选择上,选择了苹方字体,阅读效果更好[8],字体清晰明了,线条流畅,保证了用户使用时舒适度。
结语
数字媒体时代,普罗大众会接收到海量信息知识,“终身学习”理念普及与在线办公的发展,知识整理、办公记录的需求不断增加,笔记应用的重要性日趋显现。字体识别技术与笔记App 的结合,提高了App 的功能性和便捷性,同时通过载入用户的手写字体让用户在数字世界中留下自己独特的印记,以需求导向、用户导向、视觉导向出发,解构出典型的设计特征和创新架构(如图11 所示)。梳理笔记App 的发展现状,总结归纳处基于字体识别技术的笔记App 的设计策略,展开相应的设计实践,希望以此为契机,可不断深化对“字体识别技术”的手写字体在笔记App 中的应用、思考、研究,吸引更多设计师和从业者将目光聚焦于这一具有潜力的领域,共同推动其发展。
课题基金:山东省大学生创新创业训练计划项目资助《“笔迹App”— 打造专属于用户的个人知识库》(项目编号S202313320009X)
参考文献
[1]刘春爽.Android平台手写笔记系统的设计与实现[D].北京邮电大学,2022.
[2]易尧华,杨锶齐,王新宇,等.自然场景文本检测关键技术及应用[J].数字印刷,2020,(04):1-11+22.
[3]闫飞,张华,冯春成,等.基于迁移学习的卷积神经网络印刷汉字字体识别模型研究[J].数字印刷,2021,(02):36-45.
[4]赵欢.电子出版物字体替代和字体识别方法研究[D].北京信息科技大学,2018.
[5]景奕炜,魏志成.老年友善视角下的移动医疗APP适老化设计探究[J].设计,2024,37(03):90-92.
[6]黄文锋,刘颜楷.基于社会交换理论的文献笔记共享APP设计策略研究[J].设计,2023,36(02):118-120.
[7]束健.基于笔画分割的多字体汉字识别[D].济南大学,2023.
[8]李姗.博物馆标志设计中汉字图形化设计的应用研究[J].设计,2023,36(07):37-39.