欢迎访问:沃派博客 每天不定时发布IT文章相关资讯
当前位置:沃派博客-沃派网 > IT文章 > 正文

清华教授沈阳:大数据的本质是提升我们的洞察力

11-24 IT文章

杭州网讯 11月23日,由杭州市人民政府和网易集团联合主办,杭州市经济和信息化局、杭州滨江区人民政府、杭州萧山区人民政府、北京网易传媒有限公司及网易(杭州)网络有限公司承办的“2019网易未来大会”正式开幕。

清华教授沈阳:大数据的本质是提升我们的洞察力

“大数据本质上是提升我们洞察力之后获得数据红利。” 在11月23日下午举行的“2019网易未来大会”之“5G+专场”论坛上,清华大学新闻学院教授、博导沈阳发表“5G+大数据赋能时代”主题演讲。

清华教授沈阳:大数据的本质是提升我们的洞察力


沈阳举了个有趣的例子:假设做养鸡大数据,记录这只鸡一辈子跑了多路?假如记录这只鸡跑了6公路,那只鸡跑了5公路,你在标价的时候,说跑得多的那只鸡健康,收费就多一点。跑600公里收20块钱,多出来的10块钱是什么?“数据红利。”

他说,数据应用里面有几个关键问题包括大数据杀熟,人工智能增长超不过天然平台的增长,这就需要我们在社会治理当中强调平台的合规性,以及重视大数据隐私权。

沈阳表示,如今新媒体的发展是青春,我们永远要跟年轻人一起,要体验年轻人喜欢的东西。大数据的本质是洞察,只有逐步提升我们的洞察力,我们才会离真相,离我们真正探索的方向越来越近。

附:以下为清华大学新闻学院教授、博导沈阳演讲内容,根据速记整理:

在未来20、30年会发生什么事?第一个是国际的增加和GDP的增长;第二个趋势在未来30年,人类将进入地球、月球和火星三个星球的时代;第三个巨大变化是机器人的广泛普及。

我相信未来再过10年、20年,我们出门每个人都会带个机器人,我要看你不顺眼,我也看不顺眼,我们俩不用打架,我们让机器人打一架。再过30年左右,我们也会看到AR增强现实的广泛普及,当然我们也会看到生物和技术的增长,我前两天提了主从世界的立状,你每天上网八个小时是世界的立状,这是我们非常巨大的变化。

在这个里面我们用大数据分析一下5G,这些企业它的声量的变化,华为的声量是最高的,在2019年中国人的心气被两件事提升了。一个是华为,二是国庆阅兵,所以我们去分析5G我们是绕不开华为的。在这里面我们也用大数据分析了一下,跟任正非有关的观点,在任正非观点当中有对5G的自信,还有反对5G威胁论,还有对未来的展望。如果从大数据角度来看很多人提的5V的模型,我们团队提了5P的模型。我们团队抓取数据大概在1.2亿条,大概在5—10年我们数据翻一百倍是没有问题的,包括物联网设备,实际上他们产生的数据量越来越大。

在数据颗粒度方面在600个左右,在互联网公司一个人的数据大概会记两百万条,所以有了大数据之后手机比你本人更了解你自己,我们可以看得到数据的颗粒度,它的分辨率特别关键。比如说现在手机里面已经有放大50倍的功能,如果未来的手机可以放大一万倍,或者你戴个智能眼镜放大一万倍,只要进这个大厅扫描大家一下就知道有多少根头发,我讲完下台再扫一下知道大家掉了多少根头发,这就是我们说的数据分辨率和它的颗粒度。

我们团队在数据模型方面前段时间在世界人工智能大会黑客马拉松里面拿了第三名,我们在中文幽默度计算大赛拿了第一名,我们要用数据算幽默呢?有一天我女儿睡不着就问机器,问sir,sir你喜不喜欢学习,sir回答我喜不喜欢不重要,重要是你喜不喜欢。当我们有了人工智能之后我们更趋近于模拟人,我们需要对幽默化、情感化进行分析,所以在数据模型当中很重要的数据模型是什么?对人本身的模拟,这是我们团队最近做的小的工作。

我们团队在虚拟新闻检测挑战拿了第一名,这个队伍参加的人比较多,500多个队伍参加。当然分析虚拟新闻是非常非常重要的,如果有虚假新闻信息发出来会直接影响股市,在朋友圈经常发假新闻你的信誉度也非常低。中老年人比较喜欢转发谣言,我不知道大家有没有注意过,因为很多转发这一类谣言没有经历过微博时代的短兵相接的辩论和公开的传播。所以我们可以看得到在数据模型比赛当中,我们用的数据模型有12个,我们把它整合起来得到一个比较好的结果,当然我们可以用数据去分析造假,比如说在微博里面转发是不是有假的,我们可以看得到在微博当中,中间这一圈全是假的,只有边上两个节点是真实的,只有真的人不会转发假的账号内容。

版权保护: 本文由 沃派博客-沃派网 编辑,转载请保留链接: http://www.bdice.cn/html/84739.html