薛业忠
王娜娜、黄爽,一个是北京航空航天大学研究生,一个是清华大学研究生。
王娜娜还在读大三的时候,结识了一位叫张权的失语朋友。因为王娜娜不懂手语,即使与张权面对面交流,她也感到很困难。她不得不用微信与张权沟通。她很苦恼,感觉自己与张权的交流犹如网友,难以进行有声世界的沟通,她对无声世界中的朋友深表同情。同时,她还碰到一位听力有障碍的朋友,向她倾诉。这位朋友说投递求职简历后,因为自己不能接听对方的电话,而丧失了面试的机会。生活中,这样一个群体,他们因为种种原因,造成语言功能障碍。他们不能如正常人一般生活,买东西、结账、点餐等都会遇到很多麻烦。
王娜娜向闺蜜黄爽倾诉这件事,她们还通过查阅资料,知道中国失语病症患者(包括听障人士、脑中风患者、脑瘫患者和渐冻症患者),竟然高达7000万。这些人与我们的世界是隔膜的。这时候,计算机专业的王娜娜正在实验室研究基于图像的手势识别技术。她想,手语有一定的规则,如果能把自己研究的图像识别转化为语音,该多好啊!这样,就可以打破无声世界与有声世界那道难以逾越的障壁了。于是,这对还是大三的姐妹花,满怀着对失语群体的爱和同情,开始了她们孜孜探求的历程。
在研发的道路上,她们遇到了很多困难,但她们迎难而上,毫不退缩。在没有研发臂环之前,王娜娜想打破的是摄像头识别与语音的转换问题。首先,她感到摄像头识别倒不是什么难题,但是你不可能拿着摄像头对着失语者,然后才进行语音转换。黄爽听了王娜娜的困惑,直接否定了她的这种研究方向。黄爽说,国外有一些研究,也是基于图像的比较多。一般都是失语者戴着手套,手套里面有很多传感器,可以捕捉到动作。但是手套连着一堆东西,携带非常不便。还有,还要考虑失语者的心理因素。他们走到哪儿跟人交流都要戴着手套,肯定会让人有压力,感觉尊严受到伤害。
怎么办?利用图像识别肯定是不行的。她们的研究犹如抽丝剥茧一般。慢慢地,她们发现手语自动翻译的尝试也有人在做,但都还停留在实验室阶段,都有便携性差、费时伤财等缺陷。这就表明,复杂的手语翻译设备还有很大的研究空間,姐妹俩感到还有希望,还有努力的必要性。
这时候,一个新发现犹如一缕阳光照进了王娜娜那本就活跃的思维空间。一个小朋友学弹钢琴,老师说该用力的时候手指没有用力。王娜娜不知道这位老师是怎么看出来的。老师告诉王娜娜,手指有没有用力,从肌肉上就可以看出来。这提醒了王娜娜,手语的动作不是也可以在肌肉上体现出来吗?她赶快上网查询,确实有一种戴臂环来判断小朋友弹钢琴指法正确与否的研究。不同的指法动作,会触动不同区域的小臂肌肉发出不一样的信号。这不正是自己的研究方向吗?基于钢琴臂环的启发,王娜娜和黄爽打算运用这项技术,将每一个手语词汇的肌肉电信号输入系统,让人工智能深度融汇,这样,她们的“手音”臂环研究进入实质性攻克阶段。
然而,要想让电脑准确识别每一个手势动作,还需要反复采集肌肉信号。王娜娜与黄爽两个人成天在电脑前不停地举手放手,有时候一个手势要重复上千次。黄爽笑言两个人的手都快成了“麒麟臂”了。但是,两个人忙活了一个多月,才完成30个手势的肌肉信号采集。要完成几千个常用的手语动作,该用多长时间呀?初步证实这种方案可行之后,她们就把一批志同道合的朋友拉入团队。这样经过5个月的努力,2000多人的参与,终于将4000多个常用的手语动作转化成了语音,并成功录入系统之中。“手音”臂环最为重要的一环,终于研究完成。
日前,王娜娜团队的手语识别臂环,在联合国与国内一家互联网公司共同举办的创新大赛上夺得冠军。
摘自《做人与处世》