基于图像生成技术的产品设计

2024-12-27 00:00:00肖柏元
中国新技术新产品 2024年18期
关键词:产品设计神经网络创新

摘 要:图像生成是一个融合计算机视觉和自然语言处理的综合问题,在设计领域得到广泛应用。深度学习技术的图像生成模型不断发展,为产品设计的创作实践带来更多技术方面的可能性。采用图像描述技术辅助机器学习“看图说话”,不仅可以提取图像内容,而且可以高效地表示图像中的目标及其关联。本文结合深度学习技术,采用神经网络和图像边缘提取技术相结合的方法进行图像描述。使用图像生成技术进行产品设计,搭建深度学习模型,在图像数据集中进行训练,使其能生成给定目标描述的图像,探讨图像生成技术对产品设计产生的影响,为产品设计提供应用图像生成技术的创新思路。

关键词:图像生成技术;深度学习技术;神经网络;产品设计;创新

中图分类号:TP 319" " " " " 文献标志码:A

图像生成技术的发展对设计领域产生了显著影响。其提高了设计效率,使设计师能够更快地完成设计方案和效果图制作,还降低了设计成本,减少了对实体材料和人工制作的需求。图像生成技术还拓展了创意可能性,使设计师能够尝试更多元化的设计风格和表现手法,这些变革为设计领域带来了创新和更多的发展机会。未来,随着图像生成技术的不断进步和应用场景的不断拓展,图像生成技术将在设计领域发挥更加重要的作用。因此,应该积极关注图像生成技术的发展动态,不断探索其在设计领域的新应用和新可能性。

1 利用图像生成技术的产品设计思路分析

本文列举具体案例来论证图像生成技术在设计领域的应用和变革。例如,在工业产品设计领域,设计师可以利用图像生成技术快速构建逼真的三维模型和虚拟场景,进行前期设计和评估。在建筑设计领域,图像生成技术可以模拟建筑在不同光线和环境中的效果,帮助设计师更好地把握设计效果。这些案例说明图像生成技术推动了设计领域的创新和发展,并证明了其在设计领域的实用价值和潜力。

图像描述自动生成系统的基本原理是使用神经网络构建模型拟合数据[1]。系统基于编码解码器(Decoder)结构,设计原理如图1所示。系统包括训练模型和使用模型2个部分。训练模型部分包括图像数据预处理、描述信息预处理、模型搭建以及训练几个模块,使用模型部分包括模型评估、生成描述2个模块。在产品设计中,图像自动生成系统能够满足用户需求,并对相关产品进行描述,设计结果能够以模型图片的形式立体地呈现给用户。

2 深度学习模型搭建及训练

图像描述的主流设计采用Encoder-Decoder结构,Encoder的作用是将输入图像编码为特征张量,Encoder 在图像预处理阶段将图像转化为特征张量,Decoder将特征张量解码为生成词的概率。本模型引入Attention机制,即每个时间步模型都会将注意力放在特征的某一部分。Attention为一个表示概率的权重向量,与特征张量相乘后作为LSTM的输入。Decoder是LSTM建模的一种方法,其优点是对长序列输入适应性较好。将经过Attention的特征张量与LSTM网络上一个时间步的输出融合,作为LSTM下一步的输入。LSTM的输出经过全连接层变换可以生成代表原始语料库的新序列。

设输入的图像特征为x,输出为y,经过Attention变换的上下文特征为z。当图像输入时归一化为299×299,经过InceptionV3至mixed7层,再加一层最大池化(Max Pooling)输出为8×8×768维特征,再经过一层全连接层降为8×8×512维特征,reshape为64×512维特征。X为{x1,…,xi,…,xL},L大小为8×8=64,xi维度为512,即64×512。Z为{z1,…,zt,…,zc}。zt也为512维特征,共有C个,C为句子的最大单词数。t为某一个时间步,Y为{y1,…,yt,…,yc},yt为每个时刻的模型输出,yt为K维概率,K为词典的大小。zt为特征x的加权和,αt为权重。zt的计算过程如公式(1)所示。

zt=αtT×α " " " " " (1)

式中:α为输出。

αt的维度为64,记录α每个位置获得的关注度。由前一个时间步的LSTM输出与图像特征变换得到αt,如公式(2)、公式(3)所示。

et=relu(fe1×set) " " " (2)

αt=Softmax(fc(et)) " " "(3)

式中:et为序列使用Decoder输出的特征 ;relu为输出结果;fe1为由图像特征x经过包括全连接等多次变换由64×512转变为34×512维的特征,句子最大单词数为34,即最大时间步长;set为当前时间步已有词经过embedding嵌入后得到的序列;fc()为全连接层。

经过加权的zt和该时刻的文本序列融合后输入LSTM,得到的输出经过激活函数为Softmax的全连接层转化为维度为词典大小的词概率向量yt。

模型搭建和训练模块能够正确输入训练集与验证集数据,可以正常进行模型训练,还可以采用TensorBoard的方式回顾训练过程的损失变化,可以保存训练过程中表现较好的模型。

在训练过程中的损失变化曲线如图2所示。训练初期损失值下降比较快,训练中期下降速度明显减缓,训练后期下降缓慢。

模型评估模块能够正确读取测试集的数据,并正常完成评估计算,输出评估得分。模型的BLEU分数见表1。

BLEU-n计算待评价文本与参考文本的“n单位片段”的匹配度,n-单位片段即连续的n个单词,匹配度越高,两者质量越接近,待评价文本得分越高。

生成描述模块能够正确接受输入图像并进行预处理,可以获取预测结果并生成描述,返回给用户。测试实例如图3、图4所示。

由图3、图4可知,有些描述可以比较准确地表达图像的内容,最终训练完的模型在训练集上的损失值为2.880,在验证集上的损失值为3.368。训练后期验证集中的损失值比训练集上的损失值平均提高约0.5,存在一定的过拟合。

3 相关算法和技术

3.1 神经网络基本原理

20世纪80年代以来,在人工智能领域神经网络(Neural Network,NN)成为研究热点[2]。其模拟大脑中神经元的活动特性,对不同类型的数据进行平行处理。神经网络是由多个神经元互联而成的,每个神经元表示一个特殊的输出功能,称为激活函数,常见的激活函数有Sigmoid、tanh、ReLU和Softmax。1个简单的神经网络是由输入层、隐藏层和输出成组成的,每层都有若干神经元,输入层接受线性组合的输入,经过隐藏层的非线性的激活函数,得到非线性的输出,这个过程如公式(4)所示。

a=f(w‧x+b) " " " " " "(4)

式中:a为输出;f()为激活函数;w为权重 ;x 为输入 ; b 为偏移 。

引入激活函数可以为神经元引入非线性因素,使神经网络能够逼近任何非线性函数,应用于各种非线性模型中。

采用反向传播(back propagation)算法[3]对神经网络进行训练。每次运算从输入层输入向量,经过层层网络计算得到输出,根据损失函数(loss function)将输出与正确结果的差值进行计算,从最后一层开始层层后退,依次调整神经元的参数。采用这种方法不断调整参数,直至输出结果满意为止。

3.2 图像边缘提取技术

3.2.1 双向跟踪

图像生成需要建立影像边界,与传统的彩色图像边缘提取策略不同,本文提出了一种基于双向跟踪的多通道彩色图像边缘提取技术,融合正向跟踪即下跟踪(Forward Tracking,FT)和逆向跟踪即上确认(Backward Confirm,BC)的双向跟踪。前向追踪即向下追踪,其作用是建立影像的初始边界轮廓。该算法充分利用了彩色影像的光、色等特征,为进一步细化边界检测奠定了基础。反向追踪是一种向上证实的方法,其利用前向追踪来提高边界的辨识性能,保证所抽取边界的准确性和清晰度。基于此,本文提出一种将前向追踪与后向追踪相结合的多路融合算法,对彩色影像进行准确、完整和自然的边缘检测。本文研究将进一步完善现有的基于颜色特征的彩色图像边界检测方法,并为其他研究提供新思路。

双相跟踪步骤如图5所示,令E(k)(k=1,2,3)为第k个通道生成的边缘,FT定义为Ef(k)=F(E(k),E(k+1)),BC定义为Eb(k)=B(E(k),E(k+1)),其中Ef(k)为在FT操作后产生的边缘图,Eb(k)为在BC操作后产生的边缘图,该图根据多通道彩色图像边缘提取技术原理,利用双向跟踪进行边缘提取和图像检测。

3.2.2 边缘提取

基于双向跟踪的多通道彩色图像边缘提取技术算法分步效果展示如图6所示。第一行是原图,第二行是经过R、G和B 3个通道中的灰度图,第三行是在灰度图的基础上使用边缘提取算子得到的二值图。

二值化排序如图7所示,采用排序算法将第一行的3幅二值图中的边缘数目进行降序排序,得到第二行的3幅排好序的边缘二值图。双向跟踪后的结果与原图的效果展示如图8所示。

BSDS500数据集中的1幅原图如图8(a)所示,采用本文算法进行边缘提取后的最终效果如图8(b)所示。

边缘数目对比见表2。表2为经过R、G和B 3个通道的边缘提取后的边缘数目与本文算法最终边缘图的边缘数目。边缘数目为1 603、1 624和1604,在使用算法进行提取后,最终边缘数目为1 228,结果更为精准。

4 图像生成技术在产品设计中的应用以及影响

4.1 缩短产品设计创作时间,提升产品设计创作质量和效率

产品设计者利用图像生成技术辅助完成产品设计创作,将极大程度地缩短产品设计创作的时间,提升产品设计创作质量和效率。随着图像生成技术的普及和应用,专业设计软件增加了许多智能生成功能和工具,工具内置专家系统和专业图像生成资源库,用户只需明确设计需求和创意,就可以利用机器生成设计[4]。同时,利用图像生成技术智能生成的具有艺术和创造性的可编辑应用图像给产品设计者在创作素材、设计构思、结构、材质、色彩、装饰以及工艺形式等方面提供灵感,可以更好地激发设计者的创造性,创作出质量更高的设计。

4.2 使产品设计者的设计思维和逻辑发生转变

随着图像生成技术在产品设计中的广泛运用,作为产品设计核心价值中的创意部分需要设计者来进行构建,其可以利用图像生成技术辅助完成产品设计其他各环节中的实操部分。图像生成技术在产品设计中的应用使产品设计从注重表现产品的功能、造型、材质和色彩为主,转向产品整体设计方案、智能技术在产品设计中的运用为主,并重视用户体验,使产品设计者的设计思维和逻辑发生转变。产品设计者需要更聚焦于管理、创造和沟通工作,参与模型和算法的设计,建立机器学习数据库和设计算法,驱动人工智能生成和筛选设计作品[5]。设计者需要具备跨专业领域的视野和快速学习的能力,才能保持自己在行业中的从业优势和竞争力[6]。

4.3 提升产品设计的可视化体验,创新产品设计的表现形式

在传统的产品设计过程中,有设计构思、素材收集、绘制创意草图和方案图、三维建模、效果图渲染和图片后期处理等实操环节,现在可以利用图像生成技术生成具有艺术和创造性的可编辑应用图像,为产品提供了新的设计思路和方法。图像生成技术可以帮助设计师快速建立三维模型,使设计师能够更好地了解产品的外观造型和内部结构,同时可以利用虚拟技术进行产品设计的可视化展示。设计师能够在虚拟的环境中对作品进行设计和改进,能够尝试更多元化的设计风格和表现手法,使产品设计越来越有创意,创新了产品设计的表现形式。

5 结语

本文对基于图像生成技术的产品设计进行研究,对系统进行了可行性分析和需求分析,确定了基于图像生成技术的产品设计的设计思路。本文由图像生成入手,结合深度学习、神经网络和图像边缘提取技术对图像进行描述,利用信息采集对图像特征进行提取,在图像数据集中搭建深度学习模型进行训练,生成给定图像的目标描述,探讨图像生成技术对产品设计产生的影响,为产品设计提供应用图像生成技术的创新思路。

参考文献

[1]曾俊. 图像边缘检测技术及其应用研究[D]. 武汉:华中科技大学,2011.

[2]李津.图像生成技术在美术课程教育中的应用[J].美术教育研究,2024(8):154-156,175.

[3]刘云,夏贵羽,孙玉宝,等.基于人体图像生成的姿态无关人物识别[J].测控技术,2024,43(4):61-67.

[4]汪睿.图像生成技术对视觉传达设计的影响[J].科技视界,2024,14(3):46-48.

[5]王洪亮,徐嫜娣.人工智能艺术与设计[M].北京:中国传媒大学出版社,2022.

[6]郑昕怡.智能技术变革与未来设计师身份的重构[J].美术大观,2020(12):138-141.

猜你喜欢
产品设计神经网络创新
智能产品设计
包装工程(2022年12期)2022-07-04 03:05:42
《冷·暖》
中国宝玉石(2020年4期)2020-09-23 07:52:10
《教堂之夜》
中国宝玉石(2020年4期)2020-09-23 07:51:36
神经网络抑制无线通信干扰探究
电子制作(2019年19期)2019-11-23 08:42:00
LESS IS MORE:极简主义的产品设计
工业设计(2016年11期)2016-04-16 02:44:31
基于神经网络的拉矫机控制模型建立
重型机械(2016年1期)2016-03-01 03:42:04
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定