首页 » 商业 » 讯飞输入法上“新” 打造万物智能时代的输入解决方案

讯飞输入法上“新” 打造万物智能时代的输入解决方案

  从核心技术到应用场景,从家庭生活到工作生产,从现实世界到虚拟世界,科大讯飞正在描绘数字世界新未来。这一年来,科大讯飞在多模感知、深度理解、多维表达等方面获得重大技术突破。这些最新技术将如何开启万物智能时代人机交互的下一种可能呢?

云图片

  科大讯飞董事长看到IT产业从第五次浪潮往第六次浪潮发展,预判到“以语音为主,以键盘触摸为辅,以肢体语言动作为补充的人机交互时代正在到来。”在万物皆智能的时代,更智能的人机交互是一项核心能力。讯飞输入法总经理程坤表示,人工智能技术是人机交互升级迭代的内驱力;新时代面临的复杂多样的交互界面、复杂多样的输入场景以及复杂多样的用户需求,同步加速人机交互的变革。面对新考题,讯飞输入法已经储备了丰富的技术,旨在给出解决方案。

云图片

  依托于高噪识别技术能力的支撑,讯飞输入法在家居、车载、街区、公共交通、多人说话等不同高噪场景下依然能“听得清”、“更懂你”。这一次,讯飞输入法全新升级语音个性化方言免切换模型,采用Conformer Encoder音频编码和全语言专家系统,可支持普通话与20多种方言免切换语音识别。也就是说,人与形态多样的设备之间的交互难题通过搭载通用的免切换语音有了新的突破口。此外,离线方言语音识别技术和多语种识别的持续突破,进一步拓宽了语音输入场景。

  程坤特别提到,“我们看到语音交互的增长、看到越来越多用户的认可,我们相信万物智能时代,AI将助力讯飞输入法建构更大的用户价值。因为讯飞输入法12.0的发布,基于输入服务与用户需求深度链接。在新版中,讯飞输入法一方面对识别率精益求精,另一方面实现方言免切换,进一步降低语音输入的使用门槛。对于习惯说方言和带口音的用户而言,可在同一个识别模式下免去切换对应方言的操作,自由使用家乡话语音输入。例如,四川话说“老汉儿喊你吃嘎嘎”,上海话说“阿拉上海人侬晓得伐”,合肥话说“从肥东到肥西,买了一只老母鸡”……字里行间带出家乡的烟火气。

  互联网的快速发展连接起全世界,随之而来的互联网上各国语言交流也日益频繁。早前,讯飞输入法已支持主流的12种外语,而这次新版加入荷兰、土耳其、印尼、马来、菲律宾等更多语言的语音输入,总数达30种,贴合各国母语者的使用需求,使沟通更畅快。

  从“拼词库”到“拼云计算”,再到“拼服务”,输入法旨在提升人机交互体验。得益于AI技术的普及,如今的输入法不断迭代,除了帮助用户完成基础“打字”之外,还能“读懂”用户心思,甚至“适配”各类输入场景。新版采用定制的AI智能化输入引擎,不仅能为用户提供准确的首选内容,更能区分不同输入场景,例如聊天、音乐、综艺、影视、生活服务不同场景,主动提供智能候选,让指尖的输入更加轻松。

云图片

  值得一提的是,科大讯飞的多模感知做到了业界领先水平。比如手势识别,不光是简单的动作,还可以凌空手写识别,凭借单摄像头就实现一流的效果。这意味着,在虚拟世界,你可以抛开实体键盘形态,只需写写画画,就能输出信息。

云图片

  还有一项拥有实际应用的眼神识别技术,不用动手、不用开口,眼睛看到键盘上的按键就能准确打字,让每一个人都能够体验近未来的人机交互。

  随着时代发展,输入法逐渐从手机平台上脱离、独立出来,在其他终端平台上落地生根,展现出更丰富的形态。讯飞输入法全新打造的“新输入”,通过AI技术全面赋能,进一步拉近与用户的距离。