面对日益升温的AI热,讯飞输入法AndroidV8.1通过AI赋能,带来多项功能升级。除了高达98%的语音识别率和更强大的语音修改,此次新增面对面翻译及拍照输入,同时莫得键盘全新升级,拼音输入首选率提高等诸多优化,针对性解决输入难题,让高效表达更简单。
语音修改支持多候选 智能更懂你
作为业界首款搭载中文语音输入的输入法,讯飞输入法不仅做到了一分钟输入400字,创新打造出多语种实时语音翻译、超长语音输入、耳语输入、离线语音等功能,还率先在行业内做到通用语音识别率98%。同时,讯飞输入法以自然语言交互方式——语音修改来解决当前技术束手无策的 2% 不准确,支持自然语言口令修改、添增、删除文字等操作,还加入语音修改结果多候选,在机器不能准确理解语义时,通过人工选择更高效。基于Cache Base Fast Adapation技术,讯飞输入法独创的“智适应”支持一次修改自动记忆修正结果,再次输入相同内容精准识别。
对于口音和方言识别难题,讯飞输入法提出方言语音输入来解决。2017年发起“方言保护计划”,建立“中国方言库”,用智能语音留存承载传统文化积淀的方言。截至目前,讯飞输入法已支持22种方言,其中粤语、四川话、东北话等识别率均已超过90%。日前,讯飞输入法启动“方言发音人招募”公益行动,利用人工智能技术实现方言的完整复制,进而推进中国语言资源保护公益事业。
新增面对面翻译 英日韩俄多语种聊天无压力
当下翻译功能成为“爆款”,讯飞输入法尝试将语音识别、语音合成以及机器翻译等新技术融合在一起,新增面对面翻译,支持中文与英日韩俄多语种即时翻译。
与传统机器翻译不同的是,讯飞输入法把Attention Based Neural Network(基于注意力的神经网络)模型用于翻译应用上,使用比较复杂的深度神经网络和端到端的学习,尽可能多的靠大数据驱动减少人工定义的规则和特征。不仅如此,还充分考虑实际使用场景,首创面对面UI交互界面,一部手机屏幕一分为二,简化了多语种翻译操作流程。例如,在对话双方各讲母语时,另一方就会同步看到翻译结果;特别是语音播报功能的加入,让输入法有了自己的“嘴巴”,俨然身边站了一位翻译官,进一步增强翻译的实用性。
新增拍照输入 OCR智能识别文字一拍即有
一般从文件、图片中提取文字,需要手工录入大量文字,繁琐费时还可能出现错别字。基于用户刚需,讯飞输入法新增拍照输入,轻松识别出汉字并存储在文本中。
拍照输入相当于给讯飞输入法安装了一双“眼睛”。这个新功能的用心之处是不管书本、路牌、名片还是其他纸质图中的文字,都能轻松识别并提取出来,方便用户进行编辑、归类、管理,省去大量录入的时间。更令人惊喜的是,内置OCR扫描不仅能识别各类印刷体,对于手写识别准确率也高达90%以上,就算字体潦草也轻松识别。作为高效输入的一种补充,拍照输入适用于办公、商务、教育、设计等诸多应用场景,满足用户多样的需求,助力讯飞输入法成为未来最智能化的输入法。
莫得键盘升级 语音交互进化
人工智能赋能输入法不只是技术落地那么简单,未来的输入法将会是一个宽泛的概念,旨在帮助人与人之间的交流,也帮助人和物之间的沟通。从人类最自然的交互方式考虑,讯飞输入法精心打造了革新人机交互的黑科技产品,不局限于五笔、九宫格、二十六键、手写键盘,而是一个“有即是无,无即是有”的更高效的键盘形态——莫得键盘。讯飞输入法新版升级莫得键盘,颠覆传统键盘触摸按键的输入模式,通过语音交互重新定义键盘。
在不久前结束的锤子科技发布会上,罗永浩试图用TNT方式颠覆人机交互,可以看出语音交互成为提升体验至关重要的一环。使用莫得键盘输入,只凭一张嘴就能轻松打字、修改,甚至自动加标点符号,不需要学习其他技能。
人工智能正在从感知智能向认知智能跨越,如今移动端的输入方式发生了巨大的变化。讯飞输入法语音输入达到实用门槛,语音交互的比重越来越大,加上对涟漪效应的理解,已经成为高粘性的工具类产品。截至目前,讯飞输入法用户规模已经突破6亿,语音输入月覆盖率超过50%。接下来,讯飞输入法团队正思考如何持续利用AI持续创新,为用户带来更多的使用价值,让产品为用户提供更好的服务。