11月12日,以“IPv6下一代互联网:新网络、新技术、新应用”为主题的中国教育和科研计算机网CERNET第二十六届学术年会暨会员代表大会在杭州隆重开幕。来自各级政府教育主管部门的领导、全国高校专家、CERNET会员单位代表、企业代表1800多人参加本次会议。
在开幕式的主题发言环节,浙江大学教授、中国工程院院士陈纯做了题为《时序大数据实时智能处理技术及高校网络安全应用》的特邀报告。
陈纯院士表示,大数据时代的到来使得领域和行业边界愈加模糊,数据无论是对于国家、高校还是个人来说,都成为了关键的资源。在互联网以前,我们只有人类社会和物理世界,然后才有了数据产品及信息空间。在信息空间中,云计算、人工智能、VR/AR都产生了大量的数据,但需要注意的是,大数据的价值不仅仅体现在“大”上,与普通数据相比,它最大特点是带有时间戳,这就为实时进行大数据的智能处理提供了可能。
陈纯院士认为,时序大数据就是批式大数据加上流式数据,这些带有时间标签(按照时间的顺序变化,即时间序列化)的数据可以形成带有时间顺序的关系图谱、关联图谱。
分析计算结合智能模型,便构成了时序大数据实时智能技术架构,可以进行实时采集、实时加工、实时分析、实时决策,也即智能决策平台的实时决策。但研发具有快速、高效、智能且自主可控的时序大数据实时处理技术与平台,面临诸多技术难点。
关键技术一:面向复杂网络统计指标的增量计算。关键技术二:面向网络时序数据处理的动态时间窗口。关键技术三:网络事件序列识别技术(复杂事件处理 CEP)。关键技术四:动态网络图谱的实时分析计算。
陈纯指出,在时序大数据实时智能处理技术这套完整的技术体系里,需要融合实时指标计算、智能学习、智能决策、关联图谱四大平台子系统,来提供全方位的知识产生与知识应用能力。实时指标平台需要解决从原始的流水到指标的实时计算和指标的快速存储、快速读取问题;同时,也要有底层技术来解决实时的指标采集和清洗问题。
关于高校网络安全,陈纯院士认为,当前的高校网络自动化场景包括账号系统撞库攻击,数据恶意爬取攻击,公平性破坏攻击等,而时序大数据实时智能处理技术在这些方面都将发挥越来越大的作用。