起码能将这个时空全世界自然语言处理以及神经网络学习方面的研究进展加速近一年的时间。
当然这说的是马上吃透的话,能加速近一年时间。
如果这些研究团队花了两三年才搞定相应的进展,那反而是拖累他们正常的进度了。
抛开生成式文本摘要这个专利不谈。
仅仅是林灰在弄生成式文本摘要时顺手牵羊搞定的那个lh文本摘要准确度衡量模型也够牛掰的了。
如果这项技术能够被这个时空的研究团队所掌握的话,对于他们的研究也是有所助力的。
尽管林灰当初就把如何构建模型表达的已经足够清楚,就差手把手教了。
(构建模型的话首先要运用语言模型来评估算法生成语言的流畅度,然后使用相似度模型评估文本和摘要之间的语义相关性,最后为了有效评估实体、专有词的复现程度,引入原文信息量模型来评估)
但此时的研究人员似乎仍然很好奇林灰是怎么构建这一衡量标准的。
林灰记得先前伊芙·卡莉在他发的邮件中就表达了对于“lh文本摘要准确度衡量模型”究竟是如何构建的困惑。
林灰记得伊芙·卡莉当初除了好奇林灰是怎么搞定语料库这个问题之外。
其困惑主要集中在林灰究竟采用什么方法架构相似度模型的。
当知道世界最顶尖学府附属的研究机构的科研人员居然好奇这事,林灰还是意外的。
林灰踌躇满志地盖了一个“华丽的房子”。
原本以为这个时空人们会好奇林灰是怎么盖出这个房子的。
没想到反倒先被问道盖房子的木头是从哪开采的?
这就是林灰当初收到伊芙·卡莉邮件时的直观感受。
不过如果诚如伊芙·卡莉在邮件里介绍的那般,林灰也能理解伊芙·卡莉为什么困惑。
涉及到相似度模型的架构一般都是通过计算的方式。