张益达没有直接回答陆奇的提问,反而问陆奇:“听说微软小冰已经在金融领域发力了,新一代产品能抓取上市企业发布的全部公告,自动生成摘要?”
陆奇考虑了一下,才回答道:“这个版本目前还没有正式发布,你是怎么知道的啊?”
张益达笑了笑,“微软是行业领跑者,我们自然得多关注一下了。微软有高管在一些会议上,提到过只言片语,我们汇总起来就得出了一些结论。”
“没错,新一代版本的确有这项功能,微软有高层也在一些公开会议上提过那么一两句。”
微软已经公开了的信息,陆奇觉得说一下还是没什么大问题的。
他作为微软前高管,是和微软签署了保密协议的,公开或者私下场合都不能泄露微软的商业机密,否则会被追究法律责任。
但张益达的问题,显然不在其中,都半公开了,算不得什么机密。
“读取公告,进行摘要,其实这个工作人类也可以做。
微软小冰的优势就在于,听说20秒就可以完成这项工作?”
见陆奇不搭话,张益达知道他有顾忌,就继续讲道:“对于“争分夺秒”的金融从业者来说,20秒时间就可以获得精炼后的一手信息,算是很大的一个优势了。
当对手还在人工翻阅公告的时候,微软小冰的使用用户就可以进行相关的金融操作了。
换做是我,也一定会使用小冰的服务。”
“张先生,你期望锐向的人工智能应用做到这个地步吗?”陆奇问道。
张益达摇摇头,“这只是最基础的一个文本识别,和我们目前的ai反欺诈应用一样,都是“死物”。
抖视的ai审核系统可以自动识别违规、违禁的图片和视频。
这些在微软的人工智能三个阶段标准的划分中,都属于第一阶段:基本的人工智能交互,即拥有某一种或多种交互方式。
我们要做的是“活物”,给人工智能加上感官,让“她”能听、能看、能说、能思考和学习。
这就需要在语音识别、视觉识别、对话引擎、自然语言处理、机器深度学习等领域取得一定的研究成果,并且把这些功能“融为一体”。
不然的话,做出来的人工智能也是个残废,哑巴、盲人、聋子、智障儿童……”
陆奇笑了笑,“你这比喻很恰当,但你说的这个已经是微软划分的人工智能第三阶段了,具有“高级感官”。
要做到这一步,除了需要海量数据作为支撑以外,还需要包括计算机科学、心理学、哲学和语言学等在内的几乎所有的自然科学和社会科学的专业人才加盟。
微软的ai研发团队目前有5000人,明年的话这个数字会扩大为8000人。”
恐怖如斯啊!
国内人工智能细分领域的月平均工资是两万加,5000人的团队一个月发工资就要发一个亿以上,一年就是十几个亿。
这还只是工资,没有算什么实验室设备投入方面,算上那些更加恐怖。
而且这东西短时间出不了成果,出成果了也不一定能马上赚钱。
没点实力的公司,根本带不动。
不过张益达转念一想,猪猪宝一个月工资都要发10个亿出去。
一个亿好像也不是很多啊!微软除了一个微软亚洲研究院,还有很多岗位在美国。
领美刀的那些人才是真正的大牛,年薪百万,还是美刀。
不过张益达想挖这些人到中国来,恐怕不仅要拿出等同于微软的薪酬,甚至还要高出一筹才行。
没钱,就只能拿期权骗人了。
“张先生,怎么样?压力大不大?”
陆奇看张益达半天不说话,一直在那默默思考,以为他是退缩了,于是出言打趣道。
“还好,压力不算大!”
张益达表现得很淡定,“我目前旗下公司中,锐向有人工智能团队,抖视也有,然后……其他公司暂时没有涉及这块业务,就没有招纳相关领域人才了。
两家公司凑一凑的话,弄出来五百人团队应该还是可以的。
另外,我在国内还投资了商朝科技、旷视科技等一大票图像识别公司,语音识别的话,国内目前科大讯飞做得不错,也可以跟他们开展一些合作。
我们只需要把力量集中在对话引擎、自然语言处理、深度学习等几个领域就好了。”
陆奇说了一声“好”后,又继续说道:“除了人才和资金方面,还有一项东西至关重要,那就是数据。
数据需要人工智能,人工智能也需要数据。
步入“数据30”时代后,企业的数据资产暴增,常常会超出固有的业务边界,把什么垃圾数据都纳入进来。
这就导致数据量越来越大,数据质量参差不齐,数据输出结果就很难准确。
而深度学习算法需要海量的数据来进行“训练”,数据量越大越精准越好。
在机器学习或深度学习模型中,使用错误的数据或规模不够大的数据列队来训练和运行这些模型,很有可能做出来的人工智能是一个“畸形”儿!
谷歌的数据是建立在其强大的搜索业务基础上,苹果则是建立在保有量庞大的手机终端设备上面。
微软的话,则是来自于办公软件、操作系统、还有搜索业务。
张先生你如果想做出很牛的人工智能产品的话,数据必不可少。
但据我所知,中国互联网用户的大部分数据都掌握在bat手里。
锐向掌握一部分用户的金融数据,其他数据就很少了。”