封面新闻记者 马晓玉
今年年初,Rokid(中文名灵伴科技)创始人祝铭明戴着自家AR眼镜完成了一场“未来感”十足的演讲——镜片上悬浮的提词稿、手上戒指的隔空操控,瞬间引爆社交网络。
事实上,AR眼镜的真正价值,远不止于一副硬件。其设计逻辑中隐藏着更深层的社会实验——通过“无感交互”重塑人类与数字世界的连接方式。
近日,在央视《赢在AI+》节目中,智音无碍科技创始人凌志鹏演示了一项AR眼镜的新“玩法”:当听障人士打手语时,眼镜将实时翻译成语音;当健全人说话时,镜片则会显示文字。5月23日,封面新闻记者对话凌志鹏,揭秘AR眼镜如何让听障群体实现 “看见声音,说出手语”的技术突破。

技术创新
让听障人士“看见声音 说出手语”
在全球范围内,听力受损群体规模庞大,仅中国就有超过 2780 万名听障人士。传统助听设备虽能提供一定帮助,但无法真正解决听障人士与健听人之间的双向、多轮复杂沟通难题。在数字时代这洪流之中,听障人士仿佛被按下了“静音键”,逐渐与信息世界社会产生隔阂。
为助力听障人士无障碍交流,凌志鹏团队经过上千次手语数据采集,无数次大模型训练,从零构建知音聋哑人AI无障碍系统,并配套研发出了知音AR眼镜。这套系统搭载了两项核心技术:语音识别与反向手语识别技术。

听障人士正进行手语样本录入。图据受访者
升级后的语音识别功能,除具备市面上常见的语音识别能力外,还新增提示词敏感词识别与声源定位功能。当有人呼叫听障人士姓名时,其佩戴的眼镜会突出显示敏感点,同时通过四个麦克风进行声场测试,精准判断声源位置,并识别音色特征,如判断呼叫者是男是女、年长还是年幼等。此外,对于汽车鸣笛、鸟叫、流水等各类声音,产品会用特定小符号代表其含义并显示在眼镜上,让听障人士 “看见” 声音。
更具突破性的是反向手语识别技术。通过眼镜上的广角摄像头捕捉听障人士前方95度左右的手语动作,经AI大模型推断语义后翻译成语音输出,实现了手语与语音的双向实时翻译,填补了国内技术空白。

听障人士正进行手语样本录入。图据受访者
十年坚守
从听力障碍者到无障碍技术开拓者
“人为什么要活着?活着的意义是什么?”这是凌志鹏常思考的命题。在他看来,每个人给的答案都不一样,而他则更认同稻盛和夫的观点:提升自己的心性,磨炼自己的灵魂。自小饱受右耳听力障碍困扰的凌志鹏,深知听障人士的艰辛与不易。于是,让“听障人士看见声音,说出手语”就成了深埋在凌志鹏心中的一颗种子。
为了实现这一愿景,还在华中科技大学读大一的凌志鹏,带着13人的团队开启了这场“科技追光”。他们向全国听障人士发起手语样本“众筹”。“很多聋哑人听说这个项目后,主动参与动作采集,需要什么手势就拍视频发出来,每人拍了不下30余条。”凌志鹏说。

收集的手语样本。图据受访者
十年间,超过100名听障人士参与线上数据采集,团队成员也从学生成长为行业精英,凭借对无障碍事业的热爱持续攻坚,持续为技术研发与产品落地努力。这份坚持吸引来Rokid等科技企业的橄榄枝。Rokid 创始人祝铭明表示,“这件事极具价值,专注于此一定能做得更出色。”依托行业巨人的硬件生态,团队则专注突破核心算法。
目前,知音AR眼镜尚未正式发售,预估定价不超过4500元。“我们尽量让渡利润,让技术成果惠及更多人。”凌志鹏透露,团队计划在咖啡店、联通营业厅等场景设置无障碍服务点,助力听障群体融入职场,打破社会参与的壁垒。
无障碍科技
勾勒包容型数字文明图景
事实上,从AI手语翻译到智能辅具,从适老化改造到脑机接口突破,中国科技企业与社会各界正以创新之力,为残障人士、老年人等群体打造更平等、包容的数字生活新图景。
北京冬残奥会赛事期间,无障碍导航系统、AI手语播报机器人等科技应用首次大规模落地,为全球残障运动员提供“无差异”服务体验;智能电动轮椅搭载自动驾驶模块,可自主避障、爬坡,并通过手机APP远程控制;脑控打字系统可以利用非侵入式脑机接口,帮助渐冻症患者意念交流......这种科技向善的图景正在全国铺展。根据《“十四五”残疾人保障和发展规划》,到2025年,中国将建成覆盖城乡的无障碍环境体系。
站在人机交互革命的临界点,AR眼镜不再只是酷炫的科技单品。当镜片上的0与1转化为充满温度的文字与语音,我们看到的不仅是技术的跃迁,更是一个文明社会应有的模样。