云端的10亿条数据

最近,眼尖的用户都注意到了卡巴斯基安全网络出现的’10亿’条数据,并纷纷向我表示祝贺。谢谢你们!但我还是要解释一下’10亿’代表的意思。

首先,大可不必担心。这并不是10亿个你不希望在自己电脑上出现的恶意程序;而完全是另一回事,解释起来稍有些复杂。让我们先从一些基本定义开始。

一款’理想的网络安全产品’应该是这样:

能100%检测出网络攻击(且不会出任何错);

占用0%的系统资源;

不会因技术问题打扰到用户。

当然,如此滴水不漏的安全保护还未被发明出来。因此,产品的质量取决于接近完美的程度。

为此,我们使用了大量方法,而卡巴斯基安全网络(KSN)云技术则在其中扮演了重要角色。因为KSN保存在互联网上的某个地方,因此无需占用计算机的资源。换句话说,几乎所有数据均保存在那里,因此不会干扰到计算机的正常运行。正相反:数据量越大,则样例更多,因此采用机器学习技术的自动分析系统的决策就更精确。也就是说,’10亿’代表云端的数据量。这是其一。

其二。为了确保100%检测准确率(更准确地说,检测率尽可能接近100%准确,有关数字犯罪和技术的最多样数据和技术保存在了云端。除了文件散列外,还包括了恶意行为特征、统计信息和机器学习的数学模型等等(并远未达到完美的程度)。因此得益于多层保护,即实践检验和新先进技术的结合,我们得以实现新网络攻击的自动检测。而相比之下,我们做得更好。

其三。你可能会问:在云端存有10亿条数据,而受保护计算机的反恶意软件数据库内只有500万条记录,这是怎么做到的?关键在于数据内包含各种通用型项目(散列、决策树、启发式程序和基于行为的决策工具),以便在云无法使用时防范网络攻击。一条记录就能对包含成千上万个样本的整个恶意软件家族(包括将来会出现的类似的恶意软件)进行检测。但KSN云能记录和保存所有检测对象的记录,这也是为什么云数据库内元素多得多的原因。

这就是云端10亿条数据的由来。这的确是一个非常惊人的数字,显示出了网络安全领域的变化有多快。5年前,这一数据库内’仅有’5000万条数据。当时,被认为是一个可怕的数字;而现在只是笑谈而已:

如今,一个月内就有5000万条数据被添加入了数据库内。

如果是在计算机诞生前的年代,10亿这个数字又意味着什么呢。想象一下,一名簿记员的工作是在一本含10亿条记录的账簿中检查是否存在某一条记录。

假设他能在1分钟内检查30条数据。那总共要花好几百年的时间,账簿要有多厚,他的眼睛肌肉要消耗多少卡路里,他又要吃多少饭才能保证自己有足够的体力完成这项有趣且有意义的工作?

但在做这个工作前,簿记员还必须浏览一份更大的账簿,包含几乎20亿条有关受信任目标的记录!

自然在计算机时代,这类工作几乎能即时完成,且无需人类参与。此外,分析过程也千方百计进行了优化:为用户提供最快速且最可靠的安全保护,我们发明了专家系统以确保最快的检测速度和最少误报。在处理大规模恶意软件攻击时,机器学习也必不可少–系统必须教会它们如何更好地检测计算机攻击。当然,也需要网络工程师的参与,负责创建算法和调试的工作。

有些人可能会问:将10亿条数据放在一个数据库内说明了什么?这难道不是说明网络攻击数量正在快速增长吗?

没错,互联网安全局势的确很糟,我们不能逃避现实。我曾在多个场合表示卡巴斯基实验室的任务就好比寻找污水池–我们的工作是清理互联网的污水系统。没错,这是个脏活累活,有时非常令人讨厌,但总有人必须去做。

我曾看过一个某品牌洗衣粉的广告,广告里面的孩子从头脏到脚,但却很快乐–广告词是”脏点也挺好”。这同样适用于网络安全:脏点也挺好,但前提是因经过安全保护技术的分析、描述和覆盖,因此不会对任何人造成威胁。

阅读评论 0
请留言