笔奇阁

繁体版 简体版
笔奇阁 > 学霸的黑科技时代 > 第60章 给词语一个向量

第60章 给词语一个向量(3 / 4)

义进行组合,并对缺少的语法要素进行补足。

在盘古编程语言的提示下,萧铭知道自己编程的逻辑是正确的。

但是逻辑正确只是第一步,怎么让拥有向量的词语按照语法组合为新的语句,这个很难,这也是现代翻译软件和机器最大的难点。

没有关系,这是盘古最擅长的。

盘古给了萧铭几个接入入了口。

萧铭将导入大量的中英文资料,资料不仅有名著更有口水话表达的网路小说、贴吧问答、微博、推特文章等等。

未来这些资料会可以由用户们自己上传,优化程序的准确性。

盘古的数据库能将整合这些资料,熟悉每一个句子的语境,然后整理出数据模型(模拟出汉语和英语等人类思维表达方式的模型)。

这些数据会帮助“词向量”在不同的语境和语法中出现在合适的位置,如此翻译会更加准确。

这项工作最大的难点就是编译量非常大!

所以现今市面上现存的翻译软件都是采用语言学家总结的语法库,即便有少部分软件有自我学习功能,也不能做到了解和统计当今所有的语言习惯并对其作出分析。这也是现有翻译软件机械不智能错误百出的原因。

剩下的一些接口,萧铭将其接入全国各地的免费直播间,直播间主播有用普通话有用地方语言,也属于口语的表达,最具有代表性。

盘古语言将搜集各地的语音和语气将其归类编译,最后形成语音数据库和文字库相对应。

盘古编程使用方式很简单,不需要输入代码,只需要告诉逻辑意图,当萧铭告诉逻辑和方式之后,编程语言就可以明确运行。

然后……

然后计算机卡死了,卡得发烫!

萧铭废了半天功夫心血化为乌有。

劳资……

萧铭购买的笔记

『加入书签,方便阅读』