家印象中应该是戴着厚厚镜片秃头的技术员居然是高中生?!
“译狗你做的?”何向东坐下来问道。
“传国玉玺。”萧铭四个字就表明了自己的身份。
“哈哈哈!”众人笑着,也确定了萧铭的身份。
何向东掏出名片并且主动和萧铭握手介绍众人,“悠道技术部主管何向东,这位是我们市场部经理张茂……这此我们主要是想和萧……先生交流下技术上的问题。”
萧铭太年轻,何向东“先生”两个字实在是说不出口。
“没问题。”萧铭很坦然地说道:“悠道是行业巨头,能够和你们交流是我的荣幸。”
何向东就技术问题和萧铭交流起来,萧铭对答如流。
当何向东了解萧铭给词语定向量,建立神经类网络化数据库,并且学习了几千万份资料后,足足贡献了30点惊讶值。
“这……这是怎么做到的,如此庞大的数据处理和学习,现有技术是无法做到的。神经网络翻译模型,悠道也在做,但是数据量太庞大了,我们的技术员也只做了一部分,目前也是一边使用一边增加和修改。”
萧铭笑了说道:“悠道其实和谷歌一样,使用seq2seq模型和nmt模型,也就是序列到序列和神经机器翻译,简单的说就是对词语进行翻译,对句子意义数字化处理,最后按照句子意义对翻译后的词语进行排序。这样做短句的翻译没有问题,但是遇到文章和长句,单纯的句子定义不能结合上下文,句子就会拧巴了。而且就像你说的那样,nmt需要大量数据作为支撑。”
“译狗的优点是在seq2seq和nmt的基础上,网植大量的句子和文章实例,让句子的定义更准确,因为某些词语和词语之间是有固定的搭配并且出现在指定的句子里……”
萧铭只是对译狗简单的介绍,何向东就彻底折服了!