将AI翻译进行到底 搜狗同传再为GDS做中英翻译

互联网
阅读:
2019-09-28 02:18:58

近日,“GDS 2018全球数字峰会”在厦门举行,峰会围绕互联网数字领域及行业热点展开,汇聚500多位行业精英大咖,通过大会分享、论坛对话等会议模块展开思想碰撞,共议行业发展新趋势,挖掘互联网时代的最大价值,是国内具高规格、大规模的行业盛会。

在峰会现场,被称为会议标配的搜狗同传也再次亮相,为大会提供AI同传支持。在各界大咖发表精彩讲话的同时,搜狗同传将演讲内容进行了实时识别和翻译,然后以中英双语字幕滚动形式实时展现在大屏幕上,成为大会现场万众瞩目的焦点。

服务上百场大型国际会议

搜狗同传GDS2018再秀实力

事实上,发布于2016年的搜狗同传,据悉在本届GDS峰会之前,早已经历了上百场大型国际会议的检验,为前哨大会、机器之心GMIS、GMIC大会等极具影响力的重量级会议提供人工智能翻译服务等。

众所周知,对于国际会议来说,如何让来自不同国家的与会者快速准确的了解演讲内容,一直是大家共同面临的难题。以前参加国际会议,参会者通常需要佩戴同传耳机才能听懂外国演讲者所讲的内容。而近年来,人工智能技术的快速发展改变了会议同传形式,为参会者提供了诸多便捷。

机器同传作为备受大家关注的创新“新星”,它要求在语音识别的同时,以极快的反应速度,将输入语言转换成目标语言,并做出“信、达、雅”的翻译,这要比普通的语音识别和翻译难度高出几个数量级。此外,机器同传难度之高,还体现在现场演讲者的语气、讲话速度、环境等的不确定性,这在无形之中均大大提高了机器同传的工作难度。

在GDS现场,我们看到各位大咖话音刚落,搜狗同传所翻译出来的演讲内容便以中英双语字幕滚动形式显示在大屏幕上,整个过程几乎是同步进行的,而且随着演讲者话语的完整性还会实时调整、修改之前的同传结果,让现场的嘉宾们都能够一目了然的了解演讲者的讲话内容。值得注意的是,现场大咖演讲词中的高科技相关专业术语及新鲜的网络用语,也都被搜狗同传准确识别并翻译,获得了现场与会者的称赞。

依托先进的神经网络翻译技术

产品服务不断升级

在搜狗同传一如既往的稳定发挥背后,不少业内人士表示,这主要依托于其背后强大的技术支持,包括语音识别、断句、语义理解以及机器翻译能力,这些以神经网络为基础的人工智能技术,实现了有条不紊的紧密合作。

据搜狗同传相关负责人介绍,搜狗同传是基于大数据和深度学习,涵盖了搜狗自主研发的语音识别、机器翻译两项重要技术,不仅能够高效识别并翻译,还能根据语义自动修改、调整之前识别的内容,显示出更准确的传译结果。

据了解,2016年11月,搜狗同传在第三届世界互联网大会“移动互联网论坛”首次亮相,之后不断升级,在产品化的过程中,为了达到实时的效果,搜狗在速度和精度上做了很多尝试,比如使用了GRU作为搜狗同传的神经元结构,使其可以在性能保持不变的前提下,降低运算复杂度,在层数和参数量上也做了一定的精简。在提升翻译效果方面,针对实体词、集外词、对齐效果的处理上也做了很多研发工作,目前,搜狗同传可以实现高精准度的同传翻译,大大方便了参会者更好地理解演讲者所讲述的内容。

众所周知,为深度学习提供的数据量越多,机器也就越“聪明”。据悉,搜狗把实验室里的AI技术,已经落地应用到输入法、地图、搜索、浏览器等产品之中,为用户带来生活工作上的便利体验。然后再利用产品获得的数据优势,不断推动AI技术升级,从而形成一个完整的“技术——产品”闭环生态逻辑,这同样也是搜狗同传能在机器同传这个赛道保持领先优势的重要原因。

发力翻译领域

用产品AI技术更好落地

不少人疑惑,搜狗为什么发力机器翻译?

我们从搜狗CEO王小川在第四届世界互联网大会上的主题为《人工智能带来的大连接时代》的演讲中或可见一斑,他表示人工智能技术的应用,将解决互联网时代连接的瓶颈,从“解决信息的流动和不对称”走向“帮助用户进行判断决策”,最终带来大连接时代。这其中,语言相关的人工智能技术起到了重要的作用,而搜狗的人工智能技术就是以语言为核心的。

王小川认为“从狭义的人工智能,到广义的人工智能,语言是中间的交界点。因为语言既可以做简单处理,同时也是通用人工智能时代推理和知识的载体。语言可以承载我们的感知,将听觉、视觉获取的信息转化为文字。此外,文字本身也能建立问答、对话和翻译的能力,通过这种能力,能给大连接时代提供更好的机会。”

如今,随着搜狗在人工智能领域布局的不断深入,搜狗同传的身影正越来越多的出现在我们身边,我们有理由相信,随着搜狗人工智能技术的不断完善和学习能力的不断加强,不久的将来,搜狗同传还将带给我们更多惊喜。