• spacer 按产品、主题或内容类型过滤

    (23 产品)

    (65 主题)

    (0 行业)

    (3 类别)

在 IBM Bluemix 云平台上开发并部署您的下一个应用。

 

第 1 - 100 条,共 2387 条 | 下一页 显示内容简介 | 隐藏内容简介 订阅搜索结果 (RSS)

查看结果
题目 none 类别 none 日期 down
InfoSphere Guardium 与 Amazon 云,第 2 部分: 云上用于备份和还原的安全存储
云上越来越多的关系数据库,加剧了对数据保护和审计的需求。InfoSphere Guardium 提供了实时数据库安全和监视、细粒度数据库审计、自动化的合规性报告、数据级访问控制、数据库漏洞管理,以及云中的敏感数据的自动发现。借助 Amazon Relational Database Service (RDS),您可以在云中创建和使用自己的数据库实例,并围绕它们构建您自己的应用程序。这个由两部分组成的文章系列探讨了如何使用 Guardium 保护云中的数据库信息。第 1 部分描述了如何使用 Guardium 的发现功能和漏洞评估功能来保护 Amazon RDS 实例。本教程将介绍 InfoSphere Guardium 如何使用 Amazon S3 进行备份和还原。
技术文章 2015年 07月 07日
针对跨平台开发的 SQL 参考
想编写可移植应用程序吗,好消息来了! 本参考使您能够使用 SQL 轻松开发可在 DB2 数据库家族中移植的应用程序,包括 DB2 for z/OS Version 11、DB2 for i Version 7.2 和 DB2 for Linux, UNIX, and Windows V10.5。
技术文章 2015年 07月 06日
私人定制—Data Collection 在线向导模板
本文将探讨如何创造使用一种新型的在线向导模板来缩短创建项目的时间并简化发布项目至服务器端的流程。在线向导模板不依赖于专业的项目编辑工具,独立便捷,具有很强的扩展性。它不仅可以根据客户需要优化项目的创建流程,同时也能为项目管理,项目报告提供新的思路。
技术文章 2015年 07月 06日
设计一个只保存一行的 DB2 for z/OS 表
DB2 表可以保存用于应用程序测试、开发和生产的海量数据。但有时需要将该表设计为每次只动态保存一行数据。本教程将介绍让 DB2 for z/OS 表只保存一行的基本概念。
技术文章 2015年 07月 06日
利用 InfoSphere BigInsights 中的 Big SQL 处理大数据
SQL 是一个实用查询语言,但它具有一定的局限性。Big SQL 让您能够在非表格式数据上运行复杂查询,并使用与 SQL 类似的语言查询它。Big SQL 的与众不同之处在于,您可以访问非表格式数据,并且这些数据实际上并不是以典型的 SQL 数据库结构为基础。使用 Big SQL,您可以导入和处理大量数据集,包括读取 InfoSphere BigInsights 中其他处理作业已处理的输出,将该信息转换为易于查询的数据。在本文中,我们探讨如何用 Big SQL 替代您现有的基础架构和查询,以及如何采用更复杂的查询并转换它们,以便利用您的 Big SQL 环境。
技术文章 2015年 07月 02日
使用 InfoSphere BigInsights 和 IBM Accelerator for Machine Data Analytics 进行系统日志分析
了解日志之后,就会发现日志是调试、性能分析、根源分析和系统健康状态评估的一个宝库。在这个真实的业务案例中,我们将了解如何使用 InfoSphere BigInsights 和 IBM Accelerator for Machine Data Analytics 来分析系统日志,从而帮助确定性能问题的根源,还将了解如何定义一个行动计划来解决问题并跟踪项目。
技术文章 2015年 07月 02日
利用 IBM Netezza Performance Portal 2.1 在 PureData for Analytic 系统中对资源分配进行监视和调整
本文介绍了 IBM Netezza Performance Portal 2.1 和 PureData for Analytics 7.1 提供的一些新特性如何对数据仓库设备上的资源分配进行监视和调整。通过本文了解如何利用 Netezza Performance Portal 中的新视图管理调度程序规则对查询的调度和执行进行更加直接的控制。
技术文章 2015年 07月 02日
浅析 IBM SPSS Modeler 和 CaDS 如何利用 Analytic Data View 构建预测分析数据模型
传统的预测分析过程涉及到各种各样的预测分析模型以及与之匹配的数据源。通常每个模型的建立都基于一个确定的数据结构,而这个数据结构就是该模型的输入数据格式。在实际的应用场景中,各种数据集常是分散在不同的系统中且具有不同的组织形式。如何将这些异构和分散的数据进行有效的组织和预处理是预测分析过程中非常重要的一个环节。基于此,IBM SPSS Collaboration and Deployment Services (以下简称 CaDS) 在 6.0 版本中引入了分析数据视图(Analytic Data View,以下简称 ADV)功能。
技术文章 2015年 07月 02日
实战解析 Optim High Performance Unload(HPU) 远程卸载数据
企业在实际的生产环境中会产生海量的数据,当有对数据库进行操作的需求时,比如卸载数据,为了减少对数据库服务器端直接操作带来的影响,一般企业会采用在数据库客户端进行操作,并且基于对数据安全的考虑,在对数据库进行操作时对用户的权限也是有要求的。针对企业卸载数据的需求,使用 Optim High Performance Unload(简称 HPU)可以帮助用户快速、高效地卸载数据,也可以满足用户在数据库客户端进行操作时的远程卸载及使用具有特定权限的用户进行操作的要求。
技术文章 2015年 06月 24日
使用 IBM 业务分析揭示对大数据有意义的洞察
大数据分析是对大数据环境的完美补充,支持众多的用法:从捕获和报告 Web 分析,到跟踪和预测数据行为模式,再到自动化安全检测和预防策略。IBM 业务分析解决方案兼容多种平台,能够在基本和复杂的分布式计算环境中发挥作用并提供情景感知。从 CIO 到系统管理员,IBM 业务分析为大数据环境的成功提供了一个意义深远的解决方案。
技术文章 2015年 06月 23日
数据清除算法:通过 DB2 for Linux, UNIX, and Windows 高效地删除 TB 级的数据
大数据带来了数据存储和系统性能方面的挑战。我们应该让不断增大的表尽量保持在最小并有效地提高系统性能,因为较小的表和索引有助于实现快速访问;其他所有方面也是如此,小型数据库的性能要高于较大的数据库。虽然传统的数据清除技术在较小的数据库上效果不错,但在数 TB 大小的数据库上就显得有些力不从心。本教程所讨论的算法可以高效地从 DB2 数据库中删除数 TB 的数据。
技术文章 2015年 06月 18日
使用 Bluemix 和 Cloudant 构建一个企业级的 SEC 财务数据数据库
如今,互联网上有大量的非结构化或半结构化数据可供使用。NoSQL 数据库几乎能够以任何形状动态加载内容,这使得这些数据变得更加容易访问。本教程将介绍如何以可扩展商业报告语言 (XBRL) 格式构建或复制一个数据集,XBRL 是美国证券交易委员会所采用的格式。
技术文章 2015年 06月 17日
使用 InfoSphere Optim Performance Manager 命令行实用程序来远程和离线生成报告
您可以使用 InfoSphere Optim Performance Manager for DB2 for Linux, UNIX and Windows Web 控制台中预定义的报告特性,以 HTML、PDF、PPT 和 XLS 格式生成报告。本教程将介绍如何使用命令行实用程序 (CLU) 扩展这些特性。借助 CLU,无需登录到 Web 控制台,就可以离线和批量模式生成报告,计划定期运行报告,以及将报告作为附件发送给团队成员。
技术文章 2015年 06月 16日
HDFS 数据平衡规则及实验介绍
当使用 Hadoop 技术架构集群,集群内新增、删除节点,或者某个节点机器内硬盘存储达到饱和值时,都会造成集群内数据分布不均匀、数据丢失风险增加等问题出现。本文对 HDFS 内部的数据平衡方式做了介绍,通过实验案例的方式向读者解释内部数据平衡的解决办法。
技术文章 2015年 06月 15日
使用 InfoSphere Optim 11.3 实现一个数据增长解决方案
读者第一次可以探索新的数据增长架构和 InfoSphere Optim 11.3 的自助服务功能,以便了解其所有企业级数据增长架构和应用程序引退需求(retirement needs)。我们将采用一种循序渐进的方式,介绍如何使用 InfoSphere Optim 11.3 来归档、删除和恢复来自企业应用程序的数据。此外,我们还将详细介绍如何使用 InfoSphere Optim 的新的按需归档功能(使用 Optim Designer 和 Manager)。
技术文章 2015年 06月 11日
使用 BLU Acceleration 提高 ETL 性能
具有 BLU Acceleration 功能的 IBM DB2 是数据库技术方面的一个飞跃,可以提高查询性能,特别是在数据仓库 (DW) 和决策支持系统 (DSS) 环境中。它利用来自 IBM Research 的动态内存、可行性压缩、平行向量处理和数据忽略(data-skipping)创新,提供了一个独特的综合性能、易用性和成本效率。在实时报告系统中,ETL 流程需要从按列组织的表频繁地更新/删除的数据,这通常会花费更多的时间,导致报告和仪表板出现性能问题。本文将学习如何提高这些功能。
技术文章 2015年 06月 09日
Q Replication V10.2.1 提升性能新特性 Q APPLY MRI
IBM Q Replication(可简称为 QRep)产品自面世以来 20 年一直致力于数据同步技术,在世界范围内拥有广泛的客户,因此也面临着最具前瞻性的需求。如何面对越来越快速产生的数据,保持数据复制的近实时效率?本文介绍了 Q Replication V10.2.1 新特性 Q APPLY MRI(Multiple Row Insert),MRI 特性在很大程度上提高了 Q APPLY 的处理速度,希望读者通过本文能够了解 MRI 的基本原理和使用。
技术文章 2015年 06月 09日
网络物理系统和智慧城市
如今的城市环境存在许多针对网络物理系统 (CPS) 和智慧城市的挑战。本文将介绍 CPS,并提供了这项技术的真实用例。本文还将介绍智慧城市在不久的将来即将面对的社会和技术挑战。
技术文章 2015年 06月 08日
Q Replication 对新特性 Rename Column 的支持
本文详细阐述了 Q Replication 新特性 Rename Column,它解决了对列的重命名同步问题,确保了交易的完整性和时效性,希望读者通过本文能够了解 Rename Column 特性的基本原理和使用方法。
技术文章 2015年 06月 03日
使用 IBM Predictive Maintenance and Quality 实现实时数据分析
对于拥有大量资产的资本密集型行业,如石油和天然气勘探与生产,需要访问实时生产数据并准确地预测未来产量。了解如何使用 IBM Predictive Maintenance and Quality 实时加载生产数据、汇总数据、预测产量,以及填充数据库以刷新指示板。
技术文章 2015年 06月 03日
将 Hadoop 与现有的 RDBMS 相集成
学习如何集成 Apache Hadoop 与关系数据库管理系统 (RDBMS)。在这个快速生成半结构化和非结构化数据的时代中,组织正在实现这种集成设计方法。这种方法在组织对 RDBMS 进行大量投资时特别有用,但是他们仍然希望有可能从数据源(比如 Hadoop 系统中的社交媒体)中捕获和分析非结构化数据。
技术文章 2015年 06月 01日
使用 IBM InfoSphere Guardium REST API
使用 InfoSphere Guardium 实现数据安全和合规性的组织可以利用丰富的 API 来更高效地自动化流程和维护系统。从 InfoSphere Guardium 9.1 开始,Guardium API 已向外部系统公开为在线 RESTful Web 服务,这些服务为组织提供了一个现代接口,用来在 Web 门户中或通过云公开 Guardium 功能。
技术文章 2015年 06月 01日
在 InfoSphere Information Governance Catalog 中建立信息治理策略框架
数据的数量、增长速度和种类正在大幅增加,各种需求也随之而来,这些需求包括:治理和管理该数据的风险、质量和成本,以及为数据的使用提供更高的信心。这就是信息治理领域,也是一个许多人都难以入门的一个领域。本文将提供一个围绕 IBM InfoSphere Information Governance Catalog 而构建的信息治理初始框架。
技术文章 2015年 05月 28日
Q Replication 对异构数据转换的支持
本文详细阐述了 Q Replication 对异构数据转换的处理以及转化机制,分析了各种处理具体异构数据转换的场景。使用 Q Replication 产品的这一特性,可以满足对时效性要求较高的数据复制的需求,从而在业务处理上提升效率。
技术文章 2015年 05月 26日
使用 IBM IoT Foundation 和 IBM Bluemix 构建自己的可穿戴设备应用程序
构建一个混合移动应用程序来连接到可穿戴设备,并将来自该设备的数据发送到云。您将使用 IBM Bluemix、IBM Internet of Things (IoT) Foundation、Apache Cordova 和 WICED Sense Development Kit 来完成本教程这个时髦的 DIY 项目。
技术文章 2015年 05月 26日
IBM Business Analytics 最佳实践: IBM Cognos BI 身份验证和单点登录
利用这些指南,在安全系统与 IBM Cognos BI 之间实现无缝的身份验证。本文包含所涉及的技术概念和背景的重要信息,以及 IBM Cognos BI 中的身份验证和单点登录 (SSO) 的设计。本文还将讨论与受支持和不受支持的环境有关的设置要求,以及必须收集来排除 IBM Cognos BI 问题的一些信息。本文面向为系统(包括 Cognos BI)设计身份验证的安全架构师和管理员。
技术文章 2015年 05月 21日
IBM BigSQL—真正的大数据 SQL
本文从 SQL-on-Hadoop 的需求背景入手,逐步介绍 IBM BigSQL 在 SQL 语法、内存优化、负载管理、安全与监控、企业级集成等各方面的功能,最后结合实际的实际案例来直观展现 BigSQL 如何满足大数据之上的 SQL 需求。
技术文章 2015年 05月 19日
IBM Datacap 9.0 DDK 自定义面板
如果在以物理方式扫描页面时或审核处理页面时发现问题,用户可能需要与 IBM Datacap 进行交互。在这里,您可以找到创建您将要在 IBM Datacap 应用程序中使用的您自己的面板的信息。自定义面板提供了字段和数据的可替换布局和操作。
技术文章 2015年 05月 13日
IBM Datacap 9.0 DDK 自定义操作
操作是 IBM Datacap 应用程序的构建基块。在这里,您可找到创建自己的操作来在 IBM Datacap 应用程序内使用的相关信息。在无法使用标准操作来执行应用程序功能时,可以编写自定义操作来满足您的处理需求。
技术文章 2015年 05月 13日
使用 MapReduce 和 InfoSphere BigInsights 对各种文档类型进行处理和内容分析
企业通常需要分析各种文件类型的大量文档。Apache Tika 是一个免费的开源库,它从各种各样的文档格式(比如 Microsoft Word、RTF 和 PDF)中提取文本内容。了解如何在 InfoSphere BigInsights 内的 MapReduce 作业中运行 Tika,以便并行分析大量二进制文档。探索如何为了分析大量较小文件而优化 MapReduce。学习创建一个 Jaql 模块,让非 Java 编程人员可以使用 MapReduce 技术来运行可扩展的 MapReduce 作业,从而处理、分析和转换 Hadoop 内的数据。
技术文章 2015年 05月 12日
IBM Datacap 9.0 DDK 示例应用程序
DDK 包含更多 IBM Datacap 9.0 示例应用程序。这些示例展示了各种捕获和验证文档的方式,提供了应用程序结构的示例,以及可能在您的应用程序中派上用场的各种操作的用法。
技术文章 2015年 05月 12日
IBM Datacap 9.0 开发人员工具包
IBM Datacap 9.0 开发人员工具包提供了应用程序和文件来帮助无限制地扩展和自定义该产品。这些自定义可用来调整您的应用程序,以便执行独特的功能,或者在特定于您组织的需求的领域内运行。
技术文章 2015年 05月 12日
使用 Eclipse IDE 开发 IBM PureData System for Hadoop 应用程序
使用 Eclipse IDE 为 IBM PureData System for Hadoop 开发应用程序需要访问 Hadoop 集群。本文将介绍如何在已连接的客户端上设置和配置 OpenVPN,这个过程提供了对该集群的安全访问。
技术文章 2015年 05月 11日
HDFS 副本放置策略的研究和优化
云存储作为云计算的延伸和发展,在实际生产环境中越来越受到关注。其中 Hadoop 分布式文件系统 (HDFS) 就被广泛地应用于各种场景中。而如果能优化其使用的一些策略,则能大大提高生产效率。本文就是通过对 HDFS 默认的基于机架敏感的副本放置策略进行研究和优化,提出更具高效的基于用户信息和负载的副本放置策略 (UILBPS,Placement Strategy based on User Information and Load Balance),充分考虑了节点负载情况和用户历史访问的地域特征,提高了系统的性能并均衡了系统负载,降低了用户的访问延迟,提高了数据的可用性。
技术文章 2015年 05月 11日
探索高级分析平台,第 5 部分: 深入剖析数据发现和可视化
本文将探讨一种数据湖探查模式,然后介绍执行跨端到端数据流的数据集成步骤。通过一系列探查用例,本文描述了探查的各种特征和执行模式。
技术文章 2015年 05月 06日
探索高级分析平台,第 6 部分: 使用客户关怀和欺诈管理案例研究,深入探讨结合 SPSS、操作决策管理 (ODM) 和 Streams 的精心设计
使用大数据制定智慧的决策需要仔细地摄入数据。
技术文章 2015年 05月 06日
IBM OpenPages GRC 与 IBM Cognos BI 集成应用
OpenPages 为风险提供统一的整合方案,提供内部审计、财务控制、IT 风险与合规、操作风险和政策风险与合规的管理, 但其自身不内置报表显示功能。IBM Congos BI 强大的报表、分析、记分卡、仪表盘功能可以完美的和 IBM OpenPages GRC 产品结合, 使得报告流程一目了然,从而易于决策者全面的监控和管理整个业务流程,进而为决策者提供决策支持。 本文将详细介绍 IBM OpenPages GRC V7.0 如何与 IBM Cognos BI 10.2.1 手动集成,将其完整地部署在 Linux Oracle 环境中, 并着重介绍 IBM OpenPages GRC V7.0 与 IBM Cognos BI 10.2.1 的集成应用。
技术文章 2015年 05月 05日
为电子商务构建一个简单的目录管理应用程序
在本教程中,我们将通过一个基于 InfoSphere MDM Collaborative Edition 和 WebSphere Commerce Enterprise Edition 的应用程序,演示一个针对电子商务解决方案的目录管理系统。该应用程序将提供一个简单的解决方案,通过基于 Web 的 UI 来管理目录数据。它将在 MDM 中建模电子商务产品的目录数据,为目录条目的创建提供一个协作式环境,目录条目包括产品、SKU、产品包和工具包,可以在分层目录类别中组织和过滤这些条目。本教程将向读者介绍使用 InfoSphere MDM 中的 Advanced Catalog Management Asset 中发布的新特性来开发自己的解决方案。
技术文章 2015年 05月 05日
您想尝试的 3 个实验性 Bluemix 服务
了解 IBM Bluemix 上随时可用的最新样板和服务,包括精选的数据管理、内容管理、应用程序质量,以及应用程序基础架构。
技术文章 2015年 05月 05日
大规模数据集成: 使用 RDF 创建数据网络
在这个介绍数据集成标准和技术的由五部分组成的系列文章的第一部分中,Brian Sletten 将介绍资源描述框架 (RDF),RDF 是称为开放式生命周期协作服务 (OSLC) 的一套新标准的基础。作为万维网联盟 (W3C) 语义 Web 技术堆栈的一部分,RDF 旨在促进多个参与者之间的信息集成,无需进行大量的预先协调。
技术文章 2015年 05月 05日
加快 Java 企业应用程序的设计和开发
本文将介绍如何应用模型驱动架构原则来加快 Java 企业应用程序的设计和开发,Java 企业应用程序使用了一些主流技术,比如 Java Persistence API、Enterprise Java Beans 和 Java API for RESTful Web Services。本文将探讨模型驱动开发流程的每个步骤,从最初的域设计到生成 EJB 3.0 以及 JAX-RS 设计和实现。
技术文章 2015年 05月 05日
DB2 10.1 DBA for Linux, UNIX, and Windows 认证考试 611 备考教程,第 6 部分:高可用性
本教程将介绍防止数据库发生意外故障所需的数据完整性技术。本教程将了解如何配置和管理 DB2 V10.1 的高可用性 (HA) 特性,DB2 V10.1 引入了多点灾备 (HADR multiple standby) 设置,为您的任务关键型数据库提供了真正的 HA 和灾难恢复 (DR) 解决方案。本文提供的例子展示了如何对该特性进行配置。您还可以通过本文了解 DB2 pureScale 技术,它为关键的业务操作提供了持续的高可用性。本文是由 8 个部分组成的 DB2 10.1 DBA for Linux, UNIX, and Windows 认证考试 611 备考教程系列的第 6 篇。
技术文章 2015年 04月 30日
删除和重新集成 HADR 设置中的辅助备用数据库
从 IBM DB2 10.1 开始,高可用性灾难恢复 (HADR) 特性支持多个备用数据库 (multiple standby)。借助多个备用数据库,可以将数据放在两个以上的站点中,以便使用单一技术来改善数据保护。本文提供了在多个备用数据库 HADR 设置中删除和重新集成辅助备用数据库(auxiliary standby)的详细步骤。
技术文章 2015年 04月 30日
使用 InfoSphere BigInsights 来链锁和链接预定义的序列应用程序
通过链锁和链接一些代码序列,软件开发人员现在可以使用 InfoSphere BigInsights 创建自定义应用程序,使用 BigSheets 组织数据源,使用 BigIndex 增强 Apache Hadoop 索引,甚至使用 InfoSphere BigInsights 调度程序来分配自动化的 MapReduce 作业。了解您的组织如何能够在无需购买额外软件的情况下获得增值生产力。
技术文章 2015年 04月 27日
使用 InfoSphere BigInsights Big SQL 和 InfoSphere Guardium 保护敏感的 Hadoop 数据
使用 Big SQL(InfoSphere BigInsights 内针对 Hadoop 数据的 SQL 接口)的主要优势在于,它企业级的速度、功能和安全性。本教程简要概述 Big SQL 内置的安全功能,然后详细介绍与 InfoSphere Guardium 的集成,后者提供了自动化合规性报告、实时警报、动态数据屏蔽等。
技术文章 2015年 04月 23日
结合使用可穿戴技术和 Bluemix
现在可穿戴技术设备变得非常流行。它们可改善人类的生活,从技术角度讲,它是大数据的重要推动因素。本文调查分析了如今市场上的几款可穿戴设备,展示了如何使用 Bluemix 服务与这些可穿戴设备进行交互。
技术文章 2015年 04月 23日
利用 IBM Watson Content Analytics 发现和使用实际的术语
使用 IBM Watson Content Analytics (WCA) 中的语言分析来探索特定于域的技术,并构建体现了用户的 “实际” 词汇偏好的域字典。使用 WCA Studio 中的这些字典来构建概念注释器(concept annotator)。
技术文章 2015年 04月 23日
使用 IBM SPSS Modeler 中的空间时间盒挖掘数据并使用 R 可视化数据
将来自多种不同类型数据源的传统数据、非结构化数据和空间数据结合在一起,利用空间-时间盒(space-time-boxes)挖掘数据获取洞察。添加 R 可视化,支持在无需任何编程的前提下,更迅速、更轻松、更直观地构建准确的预测模型。
技术文章 2015年 04月 23日
使用 InfoSphere Optim Query Workload Tuner 以及 DB2 BLU 加速器特性优化 DB2 10.5 for Linux, UNIX, and Windows 的性能
IBM DB2 10.5 for Linux, UNIX, and Windows 中的新 BLU Acceleration 特性可帮助用户将按行组织的表(row-organized table)转化为按列组织的表(column-organized table),从而提高工作负载的性能。但这里的挑战在于了解什么表可以转换,性能可以提高多少。在这篇分步指导文章中,您将了解如何使用 Optim Query Workload Tuner 执行列组织转换、分析假设场景和提高工作负载的性能。
技术文章 2015年 04月 16日
IBM Datacap Taskmaster Capture Development Kit 简介
了解 IBM Datacap Taskmaster Capture Development Kit (DDK) 中提供的跨行业和特定于行业的样例应用程序和工具,并查找每个组件的链接。
技术文章 2015年 04月 16日
使用 Node.js 和 dashDB 服务开发一个公共交通系统模拟器
本文将介绍如何使用 IBM DevOps Services、IBM Bluemix 和 BLU Acceleration 等云服务来开发公共交通系统的模拟器。对于具备中级 JavaScript 知识并且希望开始使用云服务的开发人员,可以通过本文学习如何针对数据分析和流而开发一个简单有用的应用程序。
技术文章 2015年 04月 16日
使用 InfoSphere BigInsights 分析社交媒体网站中的文本
了解如何利用 IBM 大数据平台提供的技术创建、测试、部署定制的文本提取器,并使用它们分析社交媒体数据和其他形式的文本。
技术文章 2015年 04月 15日
使用 Flume 部署和管理可扩展的 Web 服务
机器生成的日志数据对于查找各种硬件和软件故障的根源至关重要。来自该日志数据的信息可提供改进系统架构、减缓系统退化和改善正常运行时间方面的反馈。最近,一些企业开始使用这些日志数据获取业务洞察。在使用一个容错的架构时,Flume 是一个拥有高效收集、聚合和转移大量日志数据的分布式服务。本文将介绍如何部署 Flume,以及如何将它与 Hadoop 集群和简单的分布式 Web 服务结合使用。
技术文章 2015年 04月 13日
以敏捷方式将单节点集群从 MapReduce Version 1 迁移到 YARN
YARN 是 Hadoop 集群中的处理平台的一个完全重写的架构。与第一版 Hadoop 中的经典 MapReduce 引擎相比,它在可伸缩性、高效性和灵活性上都得到了很大的提高。YARN 自 2013 年 10 月以来就被认为已经适用于生产环境,它目前被许多公司用在生产中,这些公司包括 Yahoo!、Spotify、eBay、Xing 和 Allegro 等。学习如何以敏捷方式将 Hadoop 集群从 MapReduce Version 1 (MRv1) 迁移到 YARN。
技术文章 2015年 04月 13日
DB2 BLU 在 Modeler 大数据处理的应用案例
IBM 公司在 2013 年四月发布了最新的 DB2 BLU 加速器 (BLU Acceleration) 功能,成为业界的一大亮点。如何利用它的优势提高 IBM 产品处理数据的性能,是本文描述的重点。文章首先介绍 DB2 BLU 加速器新特性,包括内存数据处理、数据忽略(data skipping)、深度压缩以及列式分析等等。结合 IBM Modeler 产品对大数据处理的特点,详细介绍 DB2 BLU 的安装配置及验证,并通过实例对比在 BLU 模式和 Regular 模式下大数据处理的性能。
技术文章 2015年 04月 13日
DB2 for Linux, UNIX, and Windows 存储过程 ADMIN_MOVE_TABLE 的性能因素
本文将介绍位于 SAP系统环境中的 IBM DB2 for Linux, UNIX, and Windows 存储过程 ADMIN_MOVE_TABLE 的性能因素。我们将通过典型的 SAP 系统特征对表进行研究。
技术文章 2015年 04月 10日
DB2 10.x 认证:您需要知道的一切
获得专业认证一直是信息技术(IT)行业的一种流行趋势。因此,许多硬件和软件供应商,包括 IBM,都提供了认证项目,旨在评估和检验个人对其产品的精通程度。但是作为 DB2 专业人员,您是否也应该成为经过认证的人员?获得认证能够帮您提高 DB2 数据库管理技能吗?或者是否有利于职业发展?本文将解答这些以及其他问题,帮助您判断 DB2 认证是否适合您,并向您展示如何决定考取一个或多个当前可用的 DB2 认证。
技术文章 2015年 04月 09日
使用 Hive 分析大型数据集
每隔 24 小时,大数据行业就会收集并记录数兆字节的数据。理解这一海量数据成为不断增长的需求。从首席执行官到工程师,都面临着根据此信息进行基本预测和制定决策的挑战。本文将向您展示如何使用 Apache Hive(一个为数据密集型分布应用程序而构建的数据仓库)分析这些大数据集。
技术文章 2015年 04月 09日
自己动手:使用 Bluemix、Cloudant 和 Raspberry Pi 构建远程监控应用程序
为了构建一个简单的监控系统,可以创建一个 IBM Bluemix 应用程序,将 Raspberry Pi 设备的摄像头模块所拍摄的照片发送到 Cloudant,并使用 Node.js 在 Web 页面上显示它们。
技术文章 2015年 04月 09日
使用 R 为 IBM SPSS Modeler 16 创建新节点
IBM SPSS Modeler(一个强大的分析工具)支持数据挖掘流程的所有阶段,包括数据准备、模型构建、部署和模型维护。IBM SPSS Modeler UI 使用一个可视数据挖掘工作台,该工作台提供了内置的数据准备、建模和输出节点,有助于快速开发分析资产。
技术文章 2015年 04月 09日
针对 Hadoop 的 SQL 访问的简单对比分析
尽管 Hadoop 通常被认为是大数据处理问题的一体适用的解决方案,但该项目管理大规模图形处理、流处理和结构化数据的可扩展处理的能力有限。了解 Big SQL,这是一个针对大规模结构化数据处理而优化的大规模并行处理 SQL 引擎。了解它与最近被引入用来提高 Hadoop 框架的大规模结构化数据处理效率的其他系统之间有何异同。
技术文章 2015年 04月 08日
机器数据分析
提高网络物理安全和增加安全系统的努力已形成一个不断发展的行业,该行业致力于超越这一挑战。闭路电视模拟摄像机正快速被更高清晰度、功能丰富的数字摄像机所取代,以便实现基于图像的安全系统。相比之下,数字摄像机更灵活、更智能,能够与云服务和数据分析更紧密地集成在一起。本文将介绍就地安全监视,它与基于云的数据分析相结合,使得在没有电源或网络基础架构的区域快速部署监视成为了可能。
技术文章 2015年 04月 07日
Sqoop:NoSQL 与 RDBMS 之间的大数据管道
Sqoop 是 Hadoop 生态系统不可分割的一部分,有助于在 NoSQL 数据存储与传统 RDBMS 之间传输数据。目前已发表了许多描述 Sqoop 命令行界面用法的技术文章。然而,截止 Sqoop 1.4.3 问世之时,尚没有任何关于 Sqoop Java API 用法的公开见解。本文将使用来自 Bombay Stock Exchange 的一个数据示例介绍 Sqoop CLI 的用法,并以 Sqoop Java API 为重点。本文旨在向有兴趣且在大数据领域工作的技术架构师、解决方案架构师、技术经理、顾问、数据科学家、技术主管和开发人员做一个初步介绍。
技术文章 2015年 04月 02日
在分区环境中配置 DB2 Text Search
DB2 Text Search 使得 DB2 数据库应用程序能够在 SQL 和 XQuery 语句中使用嵌入式的全文搜索子句来执行全文搜索。这使您能够创建强大的文本检索程序。DB2 Text Search 支持在非分区和分区数据库环境中执行全文搜索。分区设置常常用于大型工作负载,由于文本搜索索引是根据表的分区进行分区的,所以对配置和管理任务的小心规划需要考虑搜索性能和高可用性需求。本文将介绍文本索引分区模式背后的概念及其对管理的影响,还将介绍针对某种示例分区数据库设置的文本搜索配置。此外,本文还会讨论监视功能和工作负载控制选项。
技术文章 2015年 04月 02日
VizJSON:JSON 中的图形语法
本文概述了使用一个行业通用的表示法来表达可视化规则的好处。本文重点介绍了一个名为 VizJSON 的特殊的表示法,它基于 Leland Wilkinson 的 Grammar of Graphics(图形语法)方法来实现可视化。
技术文章 2015年 04月 02日
使用 R 和 InfoSphere Streams 预测用户对 Web 内容的请求
了解如何通过分析 Web 服务器日志对用户浏览网站的方式进行建模,并预测用户将会对哪些内容再次发出请求。本文将介绍如何使用一个可扩展的 Markov 模型将 Web 页面集中到一个网站上,并预测用户下一次将会导航到哪些位置。该解决方案使用了 InfoSphere Streams 和 R 在模型的基础上持续进行预测。
技术文章 2015年 04月 01日
使用 InfoSphere Data Replication Q 复制填充准实时操作型数据存储
本文将首先介绍什么是操作型数据存储(Operational Data Store)以及它在商业智能系统里扮演的角色,而后将介绍操作型数据存储的不同类型,最后将重点介绍如何通过 InfoSphere Data Replication 中的 Q 复制技术实时填充 ODS,实现不同类型的操作型数据存储,从而让企业最终能够及时获得市场信息作出决策。
技术文章 2015年 04月 01日
从 InfoSphere Information Server 连接到 DB2 for i 的完整连接指南
IBM Information Server 支持从 DB2 for System i 提取和写入 DB2 for System i。为了帮助您在建立从 Information Server 到 DB2 for i 的连接时克服遇到的任何挑战,本文提供了明确的分步说明,包括检查先决条件信息和组件,以便连接到 DB2 for i 并定义 DataStage 作业。
技术文章 2015年 03月 27日
使用 IBM InfoSphere Data Replication 实现模式复制,第 2 部分: DB2 for Linux, UNIX and Windows 10.1 中的双向模式订阅
IBM InfoSphere Data Replication 允许在相同或不同的操作平台上实现两个或两个以上的数据库管理系统之间的数据同步。各种不同的使用场景有许多。从版本 10.1 ​的 IBM infosphere Data Replication 开始,就支持模式级的复制。这意味着,对于已定义的数据库结构变更(比如创建新表),会自动添加到复制系统,不需要任何管理或干预。这不仅在主数据库中添加或更改表时消除或大大减少了管理工作,还大大增加了复制系统的可靠性,在使用它作为一个有效灾难恢复站点的同步机制时,效果尤为明显。本文是系列文章中的第二篇,使用灾难恢复用例解释了如何为 Q Replication 中提供的双向复制拓扑设置模式级订阅,Q Replication 是随 IBM InfoSphere Data Replication v10.1.3 for Linux, UNIX, and Windows 提供的技术。我们鼓励用户重现该场景。为了让此操作尽可能的方便,我们在本文的 “下载” 部分提供了多种脚本。请关注本系列中介绍单向拓扑的模式级订阅等主题的更多文章。
技术文章 2015年 03月 27日
在 InfoSphere BigInsights 中利用与内存相关的参数提升 Big SQL 性能
了解如何针对 Big SQL 配置与内存相关的参数,从而提升 Big SQL 服务器的性能。对某些参数可以利用自动配置功能。
技术文章 2015年 03月 26日
XML 还是 JSON:DB2 z/OS 数据格式选择准则
IBM DB2 z/OS 为 JSON 和 XML 都提供了文档存储支持。是 JSON 最适合某个特定的应用程序还是 XML 最适合,并不总是很明朗。本文提供了一些指导准则来帮助您选择是使用 XML 还是使用 JSON。文中包含在 DB2 z/OS 中使用 JSON 和 XML 执行创建、查询、更新和管理的一些示例。
技术文章 2015年 03月 25日
在 DB2 pureScale 环境中对 DB2 实例共享目录进行备份和还原的过程
在本文中,将会了解 DB2 pureScale 实例共享目录(sqllib_shared)的恢复过程。按照本文中描述的步骤,在 pureScale 实例中的部分或所有文件或目录不可用或无法使用的情况下,您应该能够将 pureScale 实例还原为它最后一次备份时的状态。
技术文章 2015年 03月 25日
不容错过的精彩内容:2014 年 10 部最优秀的大数据和分析教程
了解 2014 年 10 部最流行的大数据和分析教程内容,所有这些教程都旨在帮助您学习如何利用工具和技术来驾驭和分析数据。
技术文章 2015年 03月 23日
用思维的力量移动玩具车
学习如何从 Muse 可穿戴设备提取脑电波数据,以便在真实环境中执行一个动作:在本例中为移动一辆玩具车。本文将介绍如何从硬件方面使用 Arduino 和遥控车远程控制;以及在软件方面,如何使用 Bluemix 创建一个 Node.js Web 应用程序来查看实时脑电波活动。
技术文章 2015年 03月 23日
使用 IBM Big SQL over HBase,第 1 部分: 创建表和加载数据
利用 IBM 的 Big SQL 技术,您可以使用 InfoSphere BigInsights,通过行业标准的 SQL 来查询 HBase。本系列由两个部分组成,将会重点介绍创建表、数据加载方法和查询处理。在第 1 部分中,通过创建表和探讨加载数据的方式,我们将学习对 Hadoop over HBase 使用 IBM Big SQL 技术的基础知识。本文的基本思路是介绍如何使用 Big SQL 将关系表迁移到 HBase。第 2 部分将探讨查询处理,以及如何通过 JDBC 连接到 Big SQL,从而运行商业智能和报告工具,比如 BIRT 和 Cognos。
技术文章 2015年 03月 19日
Cognos BI 邮件服务器的安装与配置
在 Cognos 的开发、测试或者生产环境中,经常需要使用邮件发送报表、事件通知等,因此就需要使用邮件服务器。本文将以免费的邮件服务器 hMailServer 为例,详细介绍在 Windows 平台下如何安装、配置邮件服务器,以及与 Cognos BI Server 集成的过程。
技术文章 2015年 03月 19日
使用 IBM Big SQL over HBase,第 2 部分: 查询处理和商业智能报告
利用 IBM 的 Big SQL 技术,您可以使用 InfoSphere BigInsights,通过行业标准的 SQL 来查询 HBase。本系列由两个部分组成,将会重点介绍创建表、数据加载方法和查询处理。在第 1 部分中,通过创建表和探讨加载数据的方式,我们将学习对 Hadoop over HBase 使用 IBM Big SQL 技术的基础知识。在本文中,将了解查询处理,以及如何通过 JDBC 连接到 Big SQL,以便运行商业智能工具和报告工具,比如 BIRT 或 Cognos。
技术文章 2015年 03月 19日
利用 Python、SciKit 和文本分类来实现行为分析
了解如何根据已购买产品中描述的文本属性来构建客户行为描述模型。SciKit 是一个强大的基于 Python 的机器学习包,可用于模型构造和评估,您可以利用它学习如何构建一个模型,并将它应用于模拟的客户产品购买历史记录。在示例场景中,我们将构造一个模型,根据每​一个客户购买的具体产品和相应的文本性产品描述,向个人客户分配音乐听众感兴趣的特色内容。
技术文章 2015年 03月 17日
使用 MDM Application Toolkit 构建 MDM 中心业务流程,第 1 部分: 集成 BPM 与 MDM
本文是系列文章的第一篇文章,描述了如何集成 IBM Business Process Manager (BPM) 和主数据。具体来讲,本系列文章涉及到 BPM 8.0.1 和 InfoSphere Master Data Management (MDM) Application Toolkit,二者都在 MDM 11.0 提供。本文介绍了一个 Hello World 场景,向您展示了如何使用应用程序工具包从 MDM 中搜索和检索数据。这些数据随后会显示在 BPM Coach 上。
技术文章 2015年 03月 17日
使用 CombineFileInputFormat 在 Hadoop 中处理小的压缩文件
本文提供了具体的示例,向您展示如何通过扩展和实现 CombineFileInputFormat,在运行时读取 gzip(默认编解码器)文件的内容。还将学习如何在 MapReduce 框架内, 使用 CombineFileInputFormat 降低 Mapper 操作中处理的数据量与 HDFS 中文件的块大小之间的耦合度。
技术文章 2015年 03月 16日
将数 TB 的数据从 IBM Balanced Warehouse 迁移到 IBM Smart Analytics System
在目前这个要求越来越高的世界里,数据仓库环境在数据处理和实时数据处理需求方面都呈指数级增长。为了满足这些苛刻的需求,组织需要制定正确的决策,将应用程序迁移到适当的平台,更重要的是,组织需要在恰当的时间进行迁移。利洁时集团(Reckitt Benckiser Group plc.)是 IBM Balanced Configuration Unit (BCU) Warehouse 的早期采用者,最近升级到了下一代 IBM Smart Analytics System (ISAS),以帮助金融客户获得更好的用户体验,同时提供更高的数据容量。
技术文章 2015年 03月 16日
在 IBM PureData System for Transactions 中实现灾难恢复
了解如何在 IBM PureData System for Transactions 上设置和执行 DB2 V10.5 数据库灾难恢复。解决方案基于 DB2 高可用性和灾难恢复特性。
技术文章 2015年 03月 13日
集成 MDM Server 与企业信息系统(使用 SAP 作为示例): 使用特定于 SAP 的信息充实客户记录
本文是 “集成 MDM Server 与企业信息系统(使用 SAP 作为示例)” 教程的后续文章。在第 1 部分中,主要介绍了如何将客户主数据从 MDM Server 传播到 SAP 系统。第 2 部分主要介绍如何将添加到 SAP 系统中的记录的额外信息发送到 MDM Server。在演示的场景中,通过 SAP 生成的税务标识符对以前传播到 SAP 系统的客户记录进行了充实。SAP Intermediate Document (IDoc) 机制用于将修改的客户记录从 SAP 系统发送到企业服务总线 (ESB)。在 ESB 端,WebSphere Adapter for SAP Applications 用于拾取 IDoc 并将其数据提供给中介流。基于所提供的数据,中介流创建了 MDM Server Web 服务请求,使用税务 ID 来更新客户记录。
技术文章 2015年 03月 12日
IBM Database Conversion Workbench,第 1 部分: 概述
IBM Database Conversion Workbench (DCW) 是一个免费的插件,它向 IBM Data Studio 增添了数据库迁移功能。DCW 集成了许多用于将数据库转换成单一集成环境的工具,遵循一种基于来自 IBM 迁移顾问的最佳实践的易用框架。这个文章系列的第一篇文章将概述转换方法和 DCW 2.0 中的各种功能。
技术文章 2015年 03月 12日
DB2 Advanced Copy Services: DB2 Advanced Copy Services 的脚本化接口,第 3 部分
IBM DB2 Advanced Copy Services (DB2 ACS) 支持在 DB2 for Linux, UNIX and Windows 数据库中获取快照,以便进行备份。您可以通过存储硬件供应商实现的库(但是迄今为止,只有部分供应商实现)使用 DB2 ACS API,或者自行实现此 API,但这涉及到大量的工作。IBM DB2 10.5 改变了这一情形。
技术文章 2015年 03月 10日
DB2 Advanced Copy Services: DB2 Advanced Copy Services 的脚本化接口,第 2 部分
DB2 Advanced Copy Services 支持在 DB2 for Linux, UNIX and Windows 数据库中获取快照,以便进行备份。客户可通过其存储硬件供应商实现的库来使用 DB2 ACS API,或者自行实现此 API。此外,客户需要花费大量精力来实现此目标。IBM DB2 10.5 改变了这一情形。
技术文章 2015年 03月 10日
在网站上部署 Open Web Analytics
Open Web Analytics (OWA) 是一个领先的开源 Web 分析产品。本文提供了将 OWA 部署在 IBM Bluemix 的一个 IBM 平台即服务 (PaaS) 上的分步操作说明。托管在 Bluemix 上的 Web 应用程序,以及托管在 Bluemix 外部的应用程序,可以创建可自定义的报告,该报告中可以包含网站流量统计数据、购物车更新、转换为购买的页面查看,以及其他一些有用的度量指标。
技术文章 2015年 03月 09日
利用 Geospatial Analytics 服务监视移动设备
获得、运行和扩展一个使用了 Bluemix Geospatial Analytics 服务的 Node.js starter 应用程序。利用 Geospatial Analytics 服务,您可以从物联网监视移动中的设备。该服务从 MQTT 分析设备消息流,并实时追踪涉及一个或多个地理区域的设备位置。
技术文章 2015年 03月 05日
大数据治理系列,第七部分: 分析监管、安全与隐私管理和信息生命周期监管
本文主要介绍大数据治理统一流程参考模型第十四步“运营分析监管”、第十五步“预测分析监管”、第十六步“管理安全与隐私”、第十七步“监管信息生命周期”和第十八步“度量结果”,以及 IBM Cognos BI、SPSS Modeler、Guardium、Optim Data Growth Management 和 Optim Test Data Management 等。
技术文章 2015年 03月 05日
大数据治理系列,第六部分: 大数据监管和信息单一视图监管
本文主要介绍大数据治理统一流程参考模型第十二步“(狭义)大数据监管”、第十三步“信息单一视图监管”、IBM 大数据产品 BigInsights和Streams 以及 IBM 大数据治理方面的产品: InfoSphere DataStage、InfoSphere QualityStage。
技术文章 2015年 03月 05日
大数据治理系列,第四部分: 大数据治理统一流程参考模型的第四步到第九步
本文主要介绍大数据治理统一流程参考模型第四步“定义业务问题”、第五步“获得主管支持”、第六步“执行成熟度评估”、第七步“构建路线图”、第八步“建立组织蓝图”和第九步“了解数据”等内容,并简单介绍 IBM 信息服务器中的 InfoSphere Information Analyze、InfoSphere Federation Server、InfoSphere Replication Server 和 InfoSphere Change Data Capture 等。
技术文章 2015年 03月 05日
大数据治理系列,第五部分: 定义度量值和主数据监管
本文主要介绍大数据治理统一流程参考模型第十步“定义度量值”、第十一步“主数据监管”,以及 IBM 在主数据管理方面的产品介绍,如 InfoSphere MDM Collaboration Server、InfoSphere MDM Standard Edition 和 InfoSphere MDM Advance Edition 等。
技术文章 2015年 03月 05日
大数据治理系列,第三部分: 实施元数据管理
随着大数据技术在企业中的应用越来越广泛,企业需要在原有的元数据管理策略中增加大数据相关的内容。通常,大数据分析是受用例驱动的,企业可以通过梳理大数据用例的方式逐步完善大数据的元数据管理。本文主要介绍大数据治理统一流程参考模型第三步“实施元数据管理”,包括元数据管理成熟度模型、IBM 元数据管理相关工具等内容。
技术文章 2015年 03月 05日
大数据治理系列,第二部分: 元数据集成体系结构
在明确了元数据管理策略后需要确定实现该管理策略所需的技术体系结构,即元数据集成体系结构。本文将主要介绍大数据治理统一流程参考模型第二步“元数据集成体系结构”,具体包括元模型、元-元模型、公共仓库元模型(CWM)、CWM 发展史、OMG 的模型驱动体系结构(Model Driven Architecture,MDA)。
技术文章 2015年 03月 05日
大数据治理系列,第一部分: 大数据治理统一流程模型概述和明确元数据管理策略
在各行各业中,随处可见因数量、速度、种类和准确性结合带来的大数据问题,为了更好地利用大数据,大数据治理逐渐提上日程。大数据治理的核心是为业务提供持续的、可度量的价值。本文主要介绍大数据治理的基本概念和大数据治理统一流程参考模型的前两步:“明确元数据管理策略”和“元数据集成体系结构”。
技术文章 2015年 03月 05日
使用 DB2 10 for z/OS 和 DB2 11 for z/OS 中的时态表
时态表是在 IBM DB2 10 for z/OS 中引入的并在 V11 中得到了增强。如果需要维护数据多年来的历史版本,时态表可能对基于周期的数据很有帮助。本教程将探索应用程序如何使用时态表来管理数据的不同版本,简化服务逻辑,并提供用于审计的信息。学习何时和如何使用 3 种类型的时态表来管理基于周期的数据。
技术文章 2015年 02月 12日
使用 R 从 JSON 中的数据中获取有意义的统计方法
本文将介绍如何使用 R 这种面向统计计算的语言集成 JavaScript Object Notation (JSON) 数据,比如 IBM InfoSphere BigInsights 产生的数据。本文还将介绍基本的 R 数据类型、命令和它的图形显示。
技术文章 2015年 02月 12日
使用 Hive 作为 ETL 或 ELT 工具
Hadoop 似乎是所有大数据问题的答案。但对于大数据分析而言,传统的 SQL 和 MapReduce 技术尚有不足。标准的提取、加载和转换工具并不能高效地处理大数据。提到 Apache Hive 的时候,人们就会想到将语句转换为 MapReduce 任务。利用 Hive,您可以根据星型模式以松散方式构建一个数据库、一个数据仓库,或者一个复杂的提取、转换和加载系统,即使您不是一名程序员。
技术文章 2015年 02月 10日
构建一个 DB2 CLI 控制台来管理 SQLDB 数据库
使用您可以在 IBM 云平台 Bluemix 上快速构建和部署的应用程序,轻松地管理您的 SQLDB 数据库。
技术文章 2015年 02月 10日
使用 IBM Analytics for Hadoop 服务构建一个 Big SQL 应用程序
构建一个使用 IBM Analytics for Hadoop 服务的示例应用程序,该应用程序在一个基于云的 IBM InfoSphere BigInsights Enterprise Edition 实例上运行,将会分析社交媒体数据,以便了解 IBM Watson 品牌的全球普及范围。使用 Big SQL(IBM 基于 Hadoop 的平台 InfoSphere BigInsights 的 SQL 接口)查询数据,部署一个包含读取该数据的 Java 应用程序的 WAR 文件。为用户创建的示例应用程序可动态地对该数据运行查询。
技术文章 2015年 02月 05日

第 1 - 100 条,共 2387 条 | 下一页 显示内容简介 | 隐藏内容简介 订阅搜索结果 (RSS)