那默默思考,以为他是退缩了,于是出言打趣道。
“还好,压力不算大!”
张益达表现得很淡定,“我目前旗下公司中,锐向有人工智能团队,抖视也有,然后……其他公司暂时没有涉及这块业务,就没有招纳相关领域人才了。
两家公司凑一凑的话,弄出来五百人团队应该还是可以的。
另外,我在国内还投资了商朝科技、旷视科技等一大票图像识别公司,语音识别的话,国内目前科大讯飞做得不错,也可以跟他们开展一些合作。
我们只需要把力量集中在对话引擎、自然语言处理、深度学习等几个领域就好了。”
陆奇说了一声“好”后,又继续说道:“除了人才和资金方面,还有一项东西至关重要,那就是数据。
数据需要人工智能,人工智能也需要数据。
步入“数据3.0”时代后,企业的数据资产暴增,常常会超出固有的业务边界,把什么垃圾数据都纳入进来。
这就导致数据量越来越大,数据质量参差不齐,数据输出结果就很难准确。
而深度学习算法需要海量的数据来进行“训练”,数据量越大越精准越好。
在机器学习或深度学习模型中,使用错误的数据或规模不够大的数据列队来训练和运行这些模型,很有可能做出来的人工智能是一个“畸形”儿!
谷歌的数据是建立在其强大的搜索业务基础上,苹果则是建立在保有量庞大的手机终端设备上面。
微软的话,则是来自于办公软件、操作系统、还有搜索业务。
张先生你如果想做出很牛的人工智能产品的话,数据必不可少。
但据我所知,中国互联网用户的大部分数据都掌握在bat手里。
锐向掌握一部分用户的金融数据,其他数据就很少了。”
“是