联想作为全球领先的PC和智能设备制造商,其AI语音技术并非追求一个通用、开放的语音助手(如Siri或小爱同学),而是深度聚焦于“场景化”和“设备端”,核心目标是提升用户体验、增强设备智能、并赋能企业客户。

以下是联想AI语音技术的几个核心方面和特点:
核心技术方向
联想的语音技术研发主要围绕以下几个方向展开:
a. 设备端语音
这是联想语音技术最显著的特点,与依赖云端计算的传统语音助手不同,联想大力推行“端侧智能”。
- 优势:
- 隐私安全:语音数据在本地设备(如PC、平板)上处理,无需上传云端,最大限度地保护了用户隐私,尤其适合处理敏感信息。
- 低延迟:响应速度快,无需等待网络传输,提供更流畅的交互体验。
- 离线可用:即使在没有网络连接的情况下,核心的语音功能(如语音输入、命令控制)依然可以工作。
- 应用场景:联想的ThinkPad、Yoga等系列笔记本电脑中的语音输入、语音控制等功能,很多都基于设备端技术。
b. 自然语言理解
这是让机器“听懂”用户意图的关键,联想的NLU技术专注于理解在特定场景下(如会议、办公、学习)的用户指令。

- 能力:
- 意图识别:准确判断用户是想执行“打开应用”、“发送邮件”还是“搜索信息”等操作。
- 实体提取:从语音中提取关键信息,明天下午三点,给张三发一封关于项目报告的邮件”。
- 上下文理解:支持多轮对话,理解用户在连续对话中的指代关系,提升交互的自然度。
c. 语音合成
联想的TTS技术致力于生成更自然、更具表现力的语音。
- 特点:
- 情感化语音:能够根据不同的场景(如新闻播报、故事讲述、会议纪要)调整语音的语调、节奏和情感,让听感更舒适。
- 个性化声音:可以为虚拟角色或特定应用定制独特的声音品牌。
d. 远场语音与降噪
针对智能设备(如联想智能平板、智能显示器)的交互需求,研发了远场语音技术。
- 能力:
- 远场拾音:在数米远的距离,依然能清晰唤醒设备并接收指令。
- 声源定位:当多人同时说话时,能准确定位到目标用户。
- 强降噪算法:有效过滤掉键盘敲击声、风扇声、环境噪音等干扰,确保在嘈杂的办公或家庭环境中也能清晰识别。
主要应用场景与产品
联想的语音技术已经深度融入到其硬件产品和解决方案中:
a. 个人生产力工具
这是语音技术最广泛的应用领域。

- 语音输入法:在PC和移动端,用户可以通过语音快速、准确地输入文字,识别率高,支持方言。
- 语音控制:用户可以通过语音指令控制电脑的开关机、调节音量、打开特定软件、操作网页等,实现“动口不动手”。
- 会议纪要:在联想的会议解决方案中,语音技术可以实时将会议发言转写成文字,并自动整理摘要,极大提升办公效率。
- 内容创作:视频创作者可以通过语音控制视频剪辑软件的 timeline、添加字幕等。
b. 智能设备交互
- 智能平板/显示器:内置语音助手,用户可以通过语音查询天气、播放音乐、设置提醒、控制智能家居设备等。
- 智能PC:未来的PC将更加智能化,语音作为核心交互方式之一,可以实现更复杂的任务,如“帮我总结这篇文档的核心观点”。
c. 企业级解决方案
联想将积累的语音技术能力打包成解决方案,赋能千行百业。
- 智慧教育:在智慧教室中,老师的授课内容可以被实时转写成板书,方便学生复习。
- 智慧医疗:医生可以通过语音录入病历,将医生从繁琐的文书工作中解放出来,专注于患者。
- 智能客服:为企业提供定制化的语音客服机器人,处理标准化的咨询和业务流程。
技术亮点与优势总结
- 软硬一体,深度融合:与纯粹做算法的公司不同,联想的优势在于能将先进的语音算法深度优化到自家的硬件(芯片、麦克风阵列、扬声器)上,实现1+1>2的效果,提供最佳的整体体验。
- 以隐私为核心:设备端语音是联想在当前数据隐私日益重要的市场环境下的一个重要差异化优势,尤其受到企业级用户和注重隐私的个人用户的青睐。
- 场景驱动,而非通用:联想的语音技术不追求成为一个无所不包的“大而全”的助手,而是深耕办公、学习、创作等具体场景,解决用户在特定场景下的痛点,技术落地更扎实。
- 全球化与本地化结合:作为一家跨国公司,联想的语音技术支持多种主流语言,针对中国市场,它也在积极优化对中文方言、特定行业术语和语境的理解能力。
联想的语音技术未来可能会朝着以下方向发展:
- 多模态融合:将语音与视觉(通过摄像头理解手势、表情)、文字(理解屏幕内容)等多种交互方式深度融合,创造出更自然、更智能的“人机共生”体验。
- 超个性化:基于用户的使用习惯,提供更精准的预测和推荐,语音助手将更懂你。
- AIGC(生成式AI)结合:将语音技术与生成式AI结合,不仅能听、能说,还能根据你的指令生成内容,如“帮我写一封邮件,然后用语音发出去”。
联想人工智能实验室的语音技术是其“智能物联”战略的重要组成部分,它不追求成为独立的语音平台,而是作为智能设备的“感官”和“大脑”,让联想的每一款产品都变得更聪明、更易用、更安全。
标签: 人工智能实验室语音识别技术 人工智能语音实验室研究方向 人工智能语音实验室应用场景