办公室里。
西格巴恩和阿尔文一起研究着论文。
他只是看了个介绍,马上就意识到,论文可能会对改善数据模型、改善算法有帮助。
西格巴恩不同于阿尔文,他不会自己慢慢去研究,而是干脆喊了几个人过来,“大家放下手头的工作,先一起看看这个。”
这一看,就是两个多小时。
他们也得出了结论,“这种辅助构建数据模型的方式,确实是可行的。”
“按照这种方法来做,数据越多、效率和精准度越高,而当数据少的时候,就不适用了。”
“难点在于最初模型的构造,我们不可能推翻原本的构造,采用这种方法重新构造。”
“方法是新的,想应用却不容易。”
西格巴恩带领的是核心算法组,手下的几个员工可以说是研发中心的精英。
他们仔细研究讨论了以后,对论文上说的构建方法,已经有了基本的了解,并且能推断使用后的情况。
最后西格巴恩做了总结,“一般而言,数据分析问题,数据越多,精准度越低。”
“这个模式也不例外,但是精准度下降的速度很慢,比如,一百个数据,我们所采用的构建模式,正确率百分之九十九点九。如果是一百亿个数据,就变成百分之八十。”
“采用这个模式构建的算法,一百个数据,正确率只有百分之九十,而一百亿个数据,正确率也不会低于百分之八十五。”
“这种模型构建方式,确实非常有意义,但在应用上,还是要慢慢的研究。”
“论文上,很多只是介绍个大概,但方法是没问题的。我们或许可以试试看,如果有下个适合的项目,就能采用这种方法。”
……
阿迈瑞肯,加州,旧金山,谷歌公司研发中心,数据与数据应用实验室。