免维度爆炸而提出的模型却出现了维度爆炸。
多少有点悲剧。
事实上,并不是只有上述两个模型提出来。
这之后还有很多研究团队都在从模型层面的做了不同程度的尝试。
但这些模型要么是南辕北辙,不利于降维。
要么是在降维的同时又带来了新的问题。
总之,这些模型都有各种行不通的地方。
尽管伊芙·卡莉相信林灰是个天才。
但伊芙·卡莉觉得林灰也很难在前人无数次尝试的情况下找到一种全新的能够规避维度爆炸的低维模型。
伊芙·卡莉考虑了很久也没想通林灰究竟表达的是什么意思。
伊芙·卡莉把她刚才她的思考过程对林灰进行了阐述。
林灰听得很认真。
听完之后,林灰笑道:“你都想到了这么多种高维向低维转化的情形。
而且先前你也提到了机器识别文本时为了要机器识别自然语言往往将自然语言数值化。
而后为了将这些数值进行属性区分进一步进行了向量化。
既然你能明白这些,那你就应该知道涉及到自然语言处理方向的问题之所以很容易出现维度爆炸很大程度是因为原始数据就维度极高。
这种情况下我们为什么不直接从源头上解决问题对原始数据做些文章呢?”
听到林灰这话,伊芙·卡莉似乎灵魂深处被触动了一般,
触电般的感觉袭来,伊芙·卡莉突然激动了起来。
伊芙·卡莉颤声道:“你的意思是说,直接对原始的高维数据进行低维化处理?
处理得到低维化数据之后,在架构模型进行语义文本相似度分析?”
和聪明人说话就是比较省时省力。
林灰想要表达的差不多就是这个意思。
现在这个时空常用的编码手段常用的还是1hot编码来说吧。
这种编码虽然再