为了帮助确保孩子们在互联网上的安全,Cloud-Nanny 开发了一种创新的解决方案,使用机器学习算法和云数据服务,实时检查和分类网站,并在孩子的设备请求访问可能不合适的网站时自动阻止或提醒家长。
随着在线媒体、游戏和社交网络的创新步伐不断加快,互联网正迅速成为娱乐的默认媒介,尤其对于千禧一代而言。如果我们根据这一趋势推演未来,下一代(今天的孩子)将几乎完全通过互联网获取媒体和娱乐内容,是很有可能的。
只需目睹一个蹒跚学步的孩子在平板电脑上盯着自己喜欢的节目,或者十岁的孩子和小朋友们一起在网上玩 Minecraft,都会很容易地相信这个预言。诚然,互联网在当今儿童的生活中发挥着比以往任何时候都重要的作用,不仅是一种更便捷的传统媒体消费方式,而且还适用于全新的娱乐类别,例如 Twitch 等网站上的视频游戏流媒体。
然而,随着孩子们上网时间越来越长,接触到不适当内容的风险也越来越成为家长们的担忧。人们越来越希望为孩子们在网上可以看到的内容和可以做的事情设定明确界限,但如果不手动检查每个网站,家长几乎不可能对孩子的在线活动进行有效监督。
Cloud-Nanny 公司的产品 ChildRouter 的开发理念是为父母提供一种监控和管理家庭互联网使用情况的简单方法。ChildRouter 是一款创新型互联网路由器,允许家长根据不同设备,管理对各类网站的访问权限,让自己的 PC 和笔记本电脑不受限制,同时确保阻止孩子的手机和平板电脑访问不合适的网站。
为了将产品提升到一个新的水平,Cloud-Nanny 希望超越手动将网站列入黑名单或白名单的层面,创建更复杂的智能过滤系统,能自动识别可能不适合特定受众的网站。
Cloud-Nanny 需要找到一种架构,使其能够检查数十万个网站请求,并决定是否允许或阻止它们,而不会对最终用户的浏览体验产生明显影响。其目标是在数据库中查找网站并反馈决定,处理时间不超过 40 微秒。
Cloud-Nanny 首席执行官 Martijn Rooks 说:“IBM Db2® on Cloud 是一种理想的解决方案,可根据我们的黑名单和白名单网站数据库快速检查请求——它执行此类查询的速度非常快,而且作为基于云的数据库平台,可以轻松伸缩。最重要的是,IBM 将其作为托管服务提供,这意味着我们可以专注于开发解决方案,而不是将时间花在低级别的数据库管理任务上。”
在数据库中查找网站非常简单,但是如果孩子尝试访问数据库中尚未存在的网站,会发生什么?这就是解决方案的智能部分发挥作用的地方。通过收集大量网站,Cloud-Nanny 使用在 IBM Analytics for Apache® Spark™ 中运行的机器学习算法,训练适合其需求的模型。Spark 集群的强大功能用于创建网站分类器,能够实时对内容进行评级和分类,例如游戏网站、视频网站或包含成人内容的网站。
然后,该解决方案将结果与该家庭的现有档案进行比较,针对提出请求的设备或用户,检查该网站的特定类别是否被列为允许或禁止。如果分类算法非常确信该网站属于允许或禁止的类别,则该请求将被允许或阻止。另一方面,如果对分类不太确定,它可以提醒家长并要求他们做出判断。然后,父母决策的结果会反馈到模型中,帮助模型随着时间的推移进行学习和改进。
Martijn Rooks说:“这一解决方案的明智之处在于,相信互联网安全不是一个非黑即白的问题——有很多灰色地带,不同的父母会对每个孩子可以或不可接受的内容有不同的看法。”“此外,这些观点可能会随着时间的推移而改变——不适合 10 岁孩子的网站可能适合 14 岁孩子。Spark 机器学习非常强大,这意味着我们的解决方案可以根据家庭的需求进行调整和演变。”
Cloud-Nanny 在短短 14 个月内将该解决方案从最初的概念验证,转变为可投入生产的服务。该公司将这种快速的开发周期归功于其在 IBM Bluemix® 上构建解决方案的决定。
“当我们为 Cloud-Nanny 产品构建初始概念验证时,我们使用了另一家托管提供商,”Martijn Rooks 说。“我们花了两个月的时间来建立和配置基础架构,然后才开始真正的开发工作。借助 IBM Cloud™ ,我们几乎可以立即启动并运行。一旦了解了该平台的工作原理,以及将不同的服务整合在一起是多么容易,就可以在一两天内构建一个基本的应用程序。
“在 14 个月内从头到尾构建一个产品,并将其推向市场,这在几年前几乎是不可想象的——对于如此高级的项目,使用 Spark 等最先进的技术,效果尤其令人印象深刻。总的来说,我们估计使用 Bluemix 启动和运行项目,比使用更传统的软件开发环境至少快 50%。”
Cloud-Nanny 提供了一种更智能、更自动化的互联网流量过滤方法,消除了大多数当前基于路由器的过滤解决方案所需的繁琐微观管理,使 ChildRouter 在竞争中占据优势。
“对于当今的大多数解决方案,家长只能阻止特定网站,必须手动检查每个网站,设置自己的黑名单和白名单,”Martijn Rooks 说。“这太耗时了,而且不可避免地会有许多网站被忽视。
“通过我们的服务,家长所需要做的就是选择允许孩子访问哪些类别的网站,其余即可交给 Cloud-Nanny 处理。系统只需在不确定某个特定网站的性质时与家长核实,一旦家长对该网站做出判断,该模型就会学习和改进,并在未来更好地对同类网站进行分类。
“简而言之,Cloud-Nanny 承担了以往需要家长几个小时才能妥当完成的任务,将其变为每周只需几分钟。同时,作为一种更加可靠和主动的解决方案,它很有可能在儿童看到网站之前加以阻止,而不是在伤害发生后。”
他总结道:“从技术和业务角度来看,我们用于构建此解决方案的 IBM 技术发挥了重要作用。能在不到一年的时间内创建可投入生产的产品,且无需大量开发成本,意味着我们可以更快地将产品推向市场。从更宏观的角度来看,ChildRouter 意味着家庭可以保证孩子的上网安全,同时又不会剥夺他们享受互联网提供的所有有益的寓教于乐机会。”
© Copyright IBM Corporation 2017. IBM Software, Route 100, Somers, NY 10589. 2017 年 1 月在美国制作。IBM、IBM 徽标、ibm.com、IBM Cloud 以及 IBM Watson 是 International Business Machines Corp. 在世界各地司法辖区的注册商标。其他产品和服务名称可能是 IBM 或其他公司的商标。以下网站上的“Copyright and trademark information”部分包含了最新的 IBM 商标列表:ibm.com/legal/copytrade.shtml。本文档为自最初公布日期起的最新版本,IBM 可能随时对其进行更改。IBM 并不一定在开展业务的所有国家或地区提供所有产品或服务。文中引用的性能数据和客户实例仅作说明之用。实际性能结果可能因具体配置和操作条件而异。本文档内的信息“按现状”提供,不附有任何种类的(无论是明示的还是默示的)保证,包括不附有关于适销性、适用于某种特定用途的任何保证以及非侵权的任何保证或条件。IBM 产品根据其提供时所依据的协议条款和条件获得保证。