您的位置:首页>>千赢国际娱乐app

千赢搜狗讯飞分获IWSLT2018评测第一,到底哪个冠军更有份量

发布时间:2018-11-02 18:55:53  千赢:千赢国际    采编:即时新闻  背景:

  10月31日上午,科大讯飞和搜狗两家公司几乎在同一时间,都表示自己获得了IWSLT2018国际口语机器翻译评测比赛的第一名。看到这个夺冠“撞车”的消息,让网友们不禁产生了强烈的疑惑:又不是并列第一名(搜狗明确说明了击败讯飞),这一个比赛里为什么会有两个世界冠军呢?

  随后,我们通过IWSLT2018大赛官网并对比两家的获奖新闻,终于搞懂了这个“一个冠军,各自表述”的缘由。

  讯飞or搜狗,究竟谁是第一?

  作为国际上最具影响力的口语机器翻译评测比赛,每年举办一次的IWSLT确实是拥有足够的地位分量,至今已经举办了15届。通过查阅名单可知,IWSLT 2018 有全球很多的机器翻译领域的研究机构参加。

  地址链接如下,可自行查看:

  https://workshop2018.iwslt.org/downloads/Proceedings_IWSLT_2018.pdf

  从介绍来看,本届IWSLT 2018的口语机器翻译任务,是将英语演讲语音翻译成对应的德语文本。需要注意的是,这里所谓的翻译是把语音信号翻译成目标语言文本,并非我们熟悉的文本到文本的翻译。也就是说,这个比赛所要评测的是语音翻译能力,正是之前科大讯飞曾经闹出过“人机耦合”笑话的机器翻译技术。

  本届IWSLT2018评测比赛中,搜狗与讯飞是在两个不同的赛道里分别夺冠,一个叫做baseline模型赛道,一个叫做端到端(end-to-end)模型赛道。

  两者虽然都是冠军,含金量的差别却很大。

  对于普通用户来说,基本可以这么理解:IWSLT这场国际口语机器翻译评测大赛分为大师赛和新秀赛两个赛道。搜狗获得了baseline模型赛道的冠军,这个赛道是目前最主流的赛道,代表着实用语音翻译技术的最高水平,是本次评测的大师赛,目前市面上机器同传、翻译机等语音翻译类产品几乎都采用了类似的方法,讯飞本次也参与了这个赛道,从官方给出的成绩看,讯飞以1.6个BLEU的劣势落后搜狗位居第二位。

  另一方面,科大讯飞获得第一名的端到端(end-to-end)赛道属于本次评测新设置的赛道,各方面的技术都处于初级阶段,仍在沉淀和积累中,相当于本次评测的新秀赛,新秀是否能成长为大师,仍有待长时间的检验,还无法代表行业主流水平,搜狗本次并未参加端到端赛道的评测,但其团队在之前多个技术交流中都曾透露过正在研发端到端语音翻译技术,并取得了阶段性突破,由此可推断,搜狗参与本次评测千赢国际娱乐官网更多是检验自研的实用语音翻译技术在行业的位置。

  详解两种模型的技术差异

  作为目前最主流的应用技术,baseline模型对应的语音翻译方案,包含语音识别、机器翻译两大模块,采用的是多步走的流水线设计,即语音信号先输入语音识别系统(automatic speech recognition, ASR)得到源语言的识别文本,然后再将识别文本送入机器翻译系统(neural machine translation, NMT)输出目标语言的对应译文。

  根据搜狗在知乎上的介绍(https://zhuanlan.zhihu.com/p/45176217),搜狗同传系统就是baseline模型赛道对应的典型方案,整个系统共分为5个技术模块,除了语音识别、机器翻译、语音合成三大技术模块之外,还新增了语音预处理和文本预处理两大模块,确保三项技术能够更好的联合优化,真正实现1 + 1 + 1 > 3的效果。

  使用流水线方案的好处是,各大技术模块可以独立优化,充分利用语音识别、机器翻译技术领域内的优化技术以及海量数据,大幅提升单点技术效果,为了更加有效的将ASR和NMT两个系统连接起来,搜狗同传系统主要进行了两方面的工作:

  1) 增加了文本预处理模块处理识别文本中的识别错误、口语化表达、语气词、文本不流利、断句等问题,将处理后的文本送到文本翻译模块进行翻译,实现了语音识别和机器翻译的有效结合;

  2) 训练出语音识别、机器翻译任务内最优的模型之后,引入联合训练机制,进一步提升语音翻译效果。

  罗马不是一天建成的,搜狗在同传、翻译机等产品上对实用语音翻译技术的深耕和积累,在本次评测的成绩上得到了充分展现,官方公布的成绩上,我们看到搜狗以高达28的BLEU位居baseline赛道第一。

  PS:BLEU是一种机器翻译自动评价的方法,是衡量方案优劣的重要指标,其数值越大意味着越准确。

  官方公布的结果中,讯飞在端到端(end-to-end)赛道获得了冠军。

  端到端语音翻译技术,是指绕开语音识别、机器翻译等各模块单独优化的阶段,输入语音经过神经网络变换直接输出目标语言的译文序列,并不会产生源语言的识别中间结果。其目的是将语音翻译系统简化到一个深度神经网络中,减少识别错误等带来的翻译质量下降。

  要注意的是,端到端语音翻译方案目前仍然处于早期学术研究阶段,训练方法和神经网络具体结构都不成熟,同时由于(语音-目标语言译文)的数据对难以大规模采集,因此数据和模型优势无法形成有效的协同,效果提升收到很大的阻力。

  现阶段,端到端(end-to-end)的方案基本没有办法进行商业使用和普及推广,但已经成为未来可能优化语音翻译效果的方案之一。以科大讯飞这次夺冠的成绩来看,仅仅得到了19.4的BLEU,与baseline模型中的效果相差甚远,基本不具备实际的推广意义和商用价值。更何况,在讯飞夺冠的端到端(end-to-end)赛道之中,一共只有四支队伍而已,像是阿里巴巴和搜狗就压根都没有进行报名参赛。这两个赛道由于训练数据量的差异,各自BLEU值不具有直接的可比性。但是在baseline赛道,相同数据量的情况下,讯飞是实实在在的败给了搜狗。

  所以说,如果IWSLT国际口语机器翻译评测大赛算是一场“全明星大赛”,那么baseline模型算是“东西对抗”级别的顶级交锋。而新添加的端到端(end-to-end)项目,也只是一场非主流的新秀表演赛罢了。

  由于科大讯飞在自家的获奖宣传中,有意无意的模糊了这一层技术差别。在这里,我们也并不想去论证科大讯飞的行为对错,只是单纯从技术分析的客观角度,给各位读者们分析IWSLT比赛里两个冠军的分量区别,并希望这些中国的AI企业能够凭借自身的科研实力,取得更好的成绩。

  总之,从“同传造假门”到“再获世界第一”,希望科大讯飞未来的AI之路能走的踏实些吧。




关注千赢千赢资讯公众号(千赢国际娱乐),每天推送你感兴趣的千赢内容。

特别提醒:本网内容转载自其他媒体,目的在于传递千赢国际娱乐官网更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本千赢证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本千赢不作任何保证或承诺,并请自行核实相关内容。本千赢不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本千赢将会在24小时内处理完毕。


返回千赢 本文千赢:千赢国际

本文评论
联想常程发布会现场霸气评价友商:技术沦落 初心泯灭
“不是技术的沦落,就是初心的泯灭”,出自11月1日联想Z5Pro发布会现场的这句话,是联想...
日期:11-02
搜狗讯飞分获IWSLT2018评测第一,到底哪个冠军更有份量
10月31日上午,科大讯飞和搜狗两家公司几乎在同一时间,都表示自己获得了IWSLT2018国际口语机器翻译...
日期:11-02
短视频行业动作频频,连出新招的百度好看视频缘何切准行业脉络
11月1日,又一家短视频平台对外宣布了接下来的动作。百度旗下综合短视频平台好看视频,在2018百度世...
日期:11-02
阿里生态2000亿资金帮助中小企业迎战天猫双11,帮助生态伙伴应对挑战
2018年天猫双11在即,阿里巴巴生态力量已经全面集结。除了为消费者创造覆盖生活全方位场景的消费体...
日期:11-02
线上线下好评连连,小米双11狂欢节火热开启
11月1日小米狂欢节开启,同时也是旗舰新品小米MIX3首卖的日子。作为高端商务旗舰手机,小米MIX3是全...
日期:11-02
源自赛道 赛麟汽车展示先进技术力量
随着全社会愈发关注绿色出行,国内的新能源汽车产业可以说是群雄并起,各种新技术和产品层出不穷。
日期:11-02
亚拓士投资制作MBC游戏综艺节目 'Begin a game'
亚拓士投资制作MBC游戏综艺节目 'Begin a game'
  -MBC 游戏综艺节目 ‘Begin a game&r...
日期:11-02
以梦为马 不负韶光,飒爽秋风中开启雷克萨斯&vivo智趣之旅
静享天物,是城市人匆忙脚步不断交汇之余最向往的意境。拥抱景胜,是电车上摩肩接踵脑海中时刻都在...
日期:11-02
持家秘诀 双十一国美超市购起来 满100减50
双十一马上来了,相信大家早早就被种草了一批服装鞋帽、护肤品、家电大件….购物车里想必早就...
日期:11-02
小米宣布11月6日举行新品直播发布会:主角或为红米Note6
小米商城官微今天宣布将于11月6日下午2点举行小米11.11新品直播发布会,虽然官方并未公布新品的身份...
日期:11-02
2019年iPhone将引入升级版Face ID
2018 年 iPhone 产品线已经全部进入市场,分析师也将目光转向了明年的 iPhone 系列。知名苹果分析师...
日期:11-02
2019年折叠屏设备迎来爆发,谁将成为全球首发折叠屏手机
不得不说,相比于一些传统硬件千赢行业,智能手机行业的技术更迭速度显得有些过快了,这不,在很多...
日期:11-02
双十一红包玩法太复杂?看完本文你就全明白了
进入11月后,各大电商就正式迈入双十一大促节奏了,各种优惠活动看的人眼花缭乱,在众多优惠活动背...
日期:11-02
QQ轻游戏用户破2.5亿,内容广告将成为游戏发行新机会
11月2日,2018年腾讯全球合作伙伴大会QQ分论坛在南京开讲,腾讯公司平台与内容事业群QQ支付联合产品...
日期:11-02
三星折叠手机Galaxy F曝光 全面屏终结?
不得不承认的是,如今的手机和十年前相比,可以说是发生了天翻地覆的变化。屏幕尺寸的变大、性能的...
日期:11-02
“炫富挑战”最新摔出神单品,亮了!
如果近期有人不小心摔了一跤,千万不要去扶,因为你不一定扶得起!
日期:11-02
NOW直播向“NOW娱乐”进化,开启“直播+短视频”篇章
2018年11月2日,腾讯全球合作伙伴大会“新内容 新社交”QQ分论坛在南京举行,腾讯公司平台...
日期:11-02
品牌蓝V集体“示爱”京东之家,你值得体验更好的11.11
伴随京东11.11全球好物节打响“开门红”,京东之家和京东专卖店11.11的狂欢序幕也正式拉...
日期:11-02
写代码已经无法满足百度AI工程师了 挖掘机才是男人的浪漫
挖掘机技术哪家强?千赢国际广为流传的答案,也许会在此次百度世界大会上被彻底改写。11月1日,2018百...
日期:11-02
2018百度世界收官盘点:百度大脑一口气放出了十余项AI落地新进展
深度学习训练出的“打不败”的猜拳机,穿越唐代古画萌萌哒的AR表情……2018...
日期:11-02
千赢娱乐最新资讯