按产品、主题或内容类型过滤

(26 产品)

(69 主题)

(0 行业)

(2 类别)

第 1 - 72 条,共 72 条
显示内容简介 | 隐藏内容简介
查看结果
题目 none 类别 none 日期 none
使用 InfoSphere BigInsights 实现社交媒体数据文本分析,第 2 部分: 使用 AQL 编写文本分析程序的方法及实践
本文是“使用 InfoSphere BigInsights 实现社交媒体数据文本分析”系列文章的第二部分,具体为大家介绍 AQL 文本分析语言,如何使用 AQL 文本分析语言创建情感分析程序,以及如何发布并运行该文本分析应用程序,希望能够使读者对使用 InfoSphere BigInsights 实现社交媒体数据文本分析有一个比较全面的了解。
技术文章 2014年 11月 17日
使用 InfoSphere BigInsights 实现社交媒体数据文本分析,第 1 部分: 文本分析环境搭建及数据准备方法实践
InfoSphere BigInsights 是 IBM 基于 Hadoop 的大数据分析平台,它不仅为 Hadoop 平台提供了企业特性,还提供了丰富的分析功能。本系列文章将重点介绍 InfoSphere BigInsights 提供的文本分析功能,希望能够使读者对使用 InfoSphere BigInsights 实现社交媒体数据文本分析有一个比较全面的了解。本文作为该系列文章的第一部分,具体为大家介绍 IBM 大数据文本分析的体系结构、处理流程、如何搭建开发环境等内容。
技术文章 2014年 11月 17日
IBM BigInsights 大数据应用开发实践
IBM BigInsights 提供了基于 Eclipse 的海量数据应用程序开发套件。本文将从实际的 Web 日志分析需求入手,首先通过 BigInsights 开发工具,开发 Map/Reduce 和 JAQL 两种类型的应用以共同完成日志数据分析;然后利用发布功能将应用发布到远程 BigInsights 服务器;并通过 Web 控制台定制、部署和运行的应用程序,监控程序运行及完成收集结果。
技术文章 2012年 08月 22日
跨越 Hadoop: 通过集成 IBM Worklight 与 IBM InfoSphere BigInsights on IBM Bluemix 在移动应用程序上传输大数据视频
本文将介绍如何在移动应用程序中集成视频数据传输。在此过程中,还会重点介绍使用一些尖端技术解决的一些业务问题和带来的机会,这些技术包括 IBM InfoSphere BigInsights on IBM Bluemix 和 IBM Worklight。这是一种引人注目的趋势的一个示例,该趋势要求云服务向移动设备集成大数据,以便执行视频传输。
技术文章 2014年 10月 29日
在 InfoSphere BigInsights Big SQL V3.0 中设置和使用联邦功能
Big SQL V3.0 支持与许多数据源联邦,包括 IBM DB2 for Linux, UNIX, and Windows、IBM PureData System for Analytics、IBM PureData System for Operational Analytics、Teradata 和 Oracle。联邦使得用户能够在一条 SQL 语句中向多个数据源发送分布式请求。学习如何使用 Big SQL V3.0 中的联邦功能。
技术文章 2015年 01月 13日
企业级大数据存储、分析平台:IBM InfoSphere BigInsights 3.0 新功能介绍
本文主要介绍 IBM 对大数据的理解、Hadoop、NoSQL 数据库、BigInsights 3.0 新特性(如 Big SQL 3.0 和 Solr 等)、BigInsights 3.0 各种优势组件(如企业集成、GPFS、Adaptive MR、BigSheets、高级文本分析、改进的工作负载调度和压缩等)。
技术文章 2014年 08月 14日
使用 SQL 访问 IBM InfoSphere BigInsights - BigSQL 使用详解
大数据处理平台为我们更好地综合利用结构化、半结构化、非结构化数据、流数据以及海量数据进行分析提供了坚实的基础。目前,大数据处理技术在互联网企业已经得到了广泛的应用,银行、电信及政府等行业用户也开始逐渐采用大数据处理技术。在大数据技术推广、使用过程中,一个很大的挑战就是如何使用目前企业用户广泛使用的标准 SQL 来访问基于 Hadoop 平台的大数据,使用企业原有应用来访问大数据。现在,使用大数据技术,通常使用 Hive、Pig 及 Java 程序来访问大数据,只能支持标准 SQL 的子集,需要用户学习新的编程语言,改写企业原有的应用,为了解决上述问题,IBM 推出了 Big SQL,它使用标准的 SQL 来访问基于 Hadoop 平台的 InfoSphere BigInsights,并提供标准的 JDBC、ODBC 接口,可以使广大熟悉 SQL 的用户直接访问大数据,而且,从性能优化角度,Big SQL 提供本地查询及 Map Reduce 两种运行模式,对于小数据集,采用本地查询方式减少 Map Reduce 的运行开销,提高执行效率,对大规模数据,自动采用 Map Reduce 方式高效运行。本文具体介绍了 Big SQL 的体系结构,如何使用 Big SQL 创建、装载及查询 Hive、Hbase 表,以及查询优化的各种方法,希望可以使读者对如何使用 Big SQL 访问大数据有一个比较全面的了解。
技术文章 2014年 07月 24日
如何在 BigInsights 2.1 中基于 BigSQL 实现大数据访问
本文主要介绍如何在 BigInsights 2.1 新增的 BigSQL 功能,基于 BigSQL 如何实现对各种 Hive 和 HBase 表的访问,以及通过 BigSQL 访问 Hive 表与直接通过 Hive 访问 Hive 表之间的性能差异等。
技术文章 2013年 12月 31日
IBM Big SQL 3.0 新功能系列,第二部分: IBM InfoSphere BigInsights 3.0 环境搭建
本文主要介绍 IBM InfoSphere BigInsights 3.0 环境如何搭建,具体包括各种安装前准备如修改 hosts 文件、配置节点间互信、关闭 IPV6 功能、关闭 selinux/防火墙/dnsmasq 等服务、检查 BigInsights 所需的监听端口是否关闭、准备 BigInsights 所需的用户、安装各种操作系统补丁包、配置节点间时间同步、修改 Ulimits 和修改 /etc/sysctl.conf,以及 BigInsights 安装步骤等。
技术文章 2014年 08月 14日
IBM BigInsights Flume 轻松部署可扩展的实时日志收集系统
目前,越来越多日志的存放跨越多个计算机,例如网络日志,分布式系统的日志等等;另外这些日志往往是在系统运行时实时产生的。显而易见,对这种日志的收集,需要日志收集系统能够实时的收集;要支持在系统集群发生变化的时候快速的对日志收集系统进行相应的改动,即需要日志收集系统有可扩展性的特点。BigInsights 将实时日志收集体统 Flume 整合为产品的一部分,支持对 flume 极其相关组件 hadoop、zookeeper 的组合安装,用可视化界面为用户部署实时日志收集系统;另外 BigInsights flume 通过 flume runtime toolkit 支持快速的添加日志收集节点,无需配置,轻松实现日志收集系统的可扩展性。
技术文章 2013年 09月 29日
基于 CDH3 的 BigInsights 集群的搭建与应用
Cloudera 是 Hadoop 的重要服务提供商,目前可以提供集 Hadoop 安装、配置、管理于一体的工具包。如何在用户现有的 CDH 平台之上集成 IBM 特有的数据分析模块,既是客户实际应用中的迫切需求,也是 IBM Big Data 的重要发展策略。本文首先简要介绍 BigInsights 与 Cloudera 集成的相关背景,在此基础上介绍基于 cloudera 的 BigInsights 集群的系统架构,之后详细介绍在 Cloudera 之上的两种集成方式,最后介绍如何管理和应用集成系统。
技术文章 2013年 07月 12日
使用 InfoSphere BigInsights 查询社交媒体和结构化数据
如果您希望快速启动涉及 IBM InfoSphere BigInsights 的大数据项目,那么了解如何查询、操作和分析数据的基础知识就非常重要。本文将引导您完成一些简单的查询示例,向您展示如何读、写、筛选、细化社交媒体数据和结构化数据。您甚至可以看到业务分析师如何使用电子表格样式的工具来可视化查询结果。
技术文章 2012年 10月 08日
使用 InfoSphere BigInsights 分析社交媒体数据和结构化数据
如果您希望使用 “大数据” 而不编写代码或脚本,那么您一定希望了解一下 BigSheets。BigSheets 是 IBM InfoSphere BigInsights(一个基于开源 Apache Hadoop 项目的平台) 提供的一个用于业务分析的电子表格式工具。本文将介绍使用 BigSheets 分析通过 BigInsights 随带的示例应用程序收集的社交媒体数据和结构化数据的基本知识。您将学习如何在 BigSheets 中建模此数据,使用内置的宏函数操作此数据,创建图表来可视化您的工作,以及如何采用几种流行输出格式中的一种来导出您的分析结果。
技术文章 2012年 09月 24日
InfoSphere BigInsights 上的 Cognos Business Intelligence 10.2 报告功能
本文提供了通过 IBM Cognos Business Intelligence 10.2 使用 IBM InfoSphere BigInsights 数据的指南。
技术文章 2013年 01月 05日
了解 InfoSphere BigInsights
或许您听说过 InfoSphere BigInsights,它是 IBM 推出的用于储存和分析 “大数据” 的软件平台。您可能想知道它到底是什么。本文将介绍 BigInsights,解释该产品的设计目标、用途以及它如何与现有的软件互补。
技术文章 2011年 12月 27日
实战 IBM BigInsights,轻松实现 Hadoop 的部署与管理
部署 Hadoop 及其相关的大量组件复杂且容易出错,数量众多的管理命令也让众多初学者望而却步。而 IBM BigInsights 能够有效地解决这些问题。本文首先介绍 BigInsights,然后分析 Hadoop 部署与管理的令人头疼问题。由此展开,逐步讲述如何利用 BigInsights 轻松解决上述问题,包括部署维护 Hadoop 及其组件, 使用 BigInsights Web 图形界面控制台。最后,文章概述了 IBM BigInsights 更多更强的功能。
技术文章 2011年 09月 01日
BigInsights -- 基于 Hadoop 的数据分析平台
本文针对 IBM 最新开发的数据分析平台进行概要介绍并对其应用进行指导说明。随着信息技术应用范围的不断扩展,对数据进行挖掘分析的需求日益增加,但是信息量的不断增大及其应用构建的复杂性日益却成为了传统数据分析的一个瓶颈。IBM 构建的数据分析平台针对上述问题,基于 Hadoop 技术,对数据查询语言,数据分析软件,数据库,作业调度模块进行了有效整合,实现了对数据的有效、高效处理,保证了高度的扩展性和兼容性。
技术文章 2011年 08月 18日
利用 BigInsights Eclipse Tooling 进行 BigSheets 定制化开发
BigSheets 是 IBM InfoSphere BigInsights 提供的供业务人员使用的、电子表格式的大数据分析工具。BigSheets 默认提供了 10 余种 reader( 阅读器 ) 和几十种 function(函数)供业务分析使用,然而,在实际的应用场景中经常会需要开发定制化的 reader 或者 function 以满足不同用户的需求。BigInsights Eclipse Tooling 是 BigInsights 为开发人员提供的一个 Eclipse 插件,利用这个插件,开发人员可以非常方便的开发各种基于 Hadoop 的应用程序,如 Jaql、MapReduce、Pig 等。 BigInsights 从 2.0 版本开始提供了开发 BigSheets reader 和 function 的功能,通过这个插件,我们可以非常方便地进行 BigSheets 定制化开发。本文在简要介绍 BigSheets 和 Eclipse Tooling 的基础上,重点讲解 BigSheets 定制化开发中涉及的概念、要求,并以案例演示 BigSheets 应用程序的开发、发布、部署以及使用。
技术文章 2013年 11月 02日
探索 InfoSphere BigInsights 集群和样例应用程序
如果您希望快速开始构建涉及 IBM InfoSphere BigInsights 的 “大数据” 项目,您需要熟悉它集成的 Web 控制台。通过此工具,可以分析集群的健康状况,导航分布式的文件系统,启动 IBM 提供的样例应用程序,监视作业和工作流状态,以及使用电子表格样式的工具分析数据。本文介绍 Web 控制台,重点介绍可帮助提高项目实施速度的重要功能。
技术文章 2012年 05月 24日
InfoSphere BigInsights 上的 Cognos Business Intelligence 10.2 报告功能
本文提供了通过 IBM Cognos Business Intelligence 10.2 使用 IBM InfoSphere BigInsights 数据的指南。
技术文章 2013年 01月 05日
集成 PureData System for Analytics 和 InfoSphere BigInsights 以执行电子邮件分析
PureData System for Analytics 是 IBM 的核心仓库平台。本文将会解释如何将它与 IBM 企业就绪的 Hadoop 发行版 InfoSphere BigInsights 相集成。我们将探讨集成概念,以及这种集成的主要用途,将 BigInsights 的高级文本分析功能与您的仓库相结合。我们将演示如何创建一个小型场景,使用从电子邮件提取的信息来充实员工数据。然后我们将演示如何将此信息提取到 BigInsights 中,如何将提取的结果上传到 PureData for Analytics。最后我们还会展示如何从仓库访问存储在 BigInsights 中的数据,以简化下钻功能。
技术文章 2013年 07月 23日
使用 InfoSphere BigInsights Big SQL 和 InfoSphere Guardium 保护敏感的 Hadoop 数据
使用 Big SQL(InfoSphere BigInsights 内针对 Hadoop 数据的 SQL 接口)的主要优势在于,它企业级的速度、功能和安全性。本教程简要概述 Big SQL 内置的安全功能,然后详细介绍与 InfoSphere Guardium 的集成,后者提供了自动化合规性报告、实时警报、动态数据屏蔽等。
技术文章 2015年 04月 23日
使用 InfoSphere BigInsights 开发、发布并部署您的第一个大数据应用程序
开发您的第一个大数据应用程序并在分布式计算环境中部署它并不是一项艰巨的任务。了解如何使用针对 InfoSphere BigInsights 的基于 Eclipse 的工具加快应用程序开发,打包应用程序以便在基于 Web 的目录中发布它,并且部署您的应用程序,以便企业员工和其他人可以轻松地启动该应用程序。
技术文章 2012年 12月 17日
使用 InfoSphere BigInsights 来链锁和链接预定义的序列应用程序
通过链锁和链接一些代码序列,软件开发人员现在可以使用 InfoSphere BigInsights 创建自定义应用程序,使用 BigSheets 组织数据源,使用 BigIndex 增强 Apache Hadoop 索引,甚至使用 InfoSphere BigInsights 调度程序来分配自动化的 MapReduce 作业。了解您的组织如何能够在无需购买额外软件的情况下获得增值生产力。
技术文章 2015年 04月 27日
Bluemix 上的 Analytics for Hadoop,第 3 部分: Bluemix 上的 Analytics for Hadoop:将数据加载到 InfoSphere BigInsights 中
将数据加载到 InfoSphere BigInsights Hadoop 环境中,了解可用的选项,并快速检查手头的数据。
技术文章 2014年 12月 18日
IBM Accelerator for Machine Data Analytics,第 6 部分: 加快 InfoSphere BigInsights 应用程序的故障排除
使用 IBM Accelerator for Machine Data Analytics 与 IBM InfoSphere BigInsights 执行 Hadoop 日志分析,加快 InfoSphere BigInsights 应用程序的故障排除。
技术文章 2015年 11月 03日
为 JSON 数据启用 IBM BigInsights Big SQL,第 1 部分
随着 JavaScript 成为主导,JSON 已快速成为在应用程序和服务之间表示和共享数据的普遍标准。客户和用户常常在论坛和社区中进行查询,寻找有关在 Big SQL 中使用 JSON 数据的信息。本教程的主要目的是介绍使用 Big SQL 处理 JSON 数据所涉及的步骤。文中将指导 Big SQL 客户定义 Big SQL 表来存储 JSON 数据,将 JSON 数据存储在 Big SQL 表内,并使用 Big SQL 查询处理 JSON 数据。Big SQL 是 IBM BigInsights 相对于大数据平台的重要优势,本教程将帮助填补它们之间的关键空白,以便利用此功能,本文还将查看 Big SQL 查询的执行速度比具有 JSON 数据的其他格式快多少。
技术文章 2015年 09月 28日
使用 InfoSphere BigInsights 和 IBM Accelerator for Machine Data Analytics 进行系统日志分析
了解日志之后,就会发现日志是调试、性能分析、根源分析和系统健康状态评估的一个宝库。在这个真实的业务案例中,我们将了解如何使用 InfoSphere BigInsights 和 IBM Accelerator for Machine Data Analytics 来分析系统日志,从而帮助确定性能问题的根源,还将了解如何定义一个行动计划来解决问题并跟踪项目。
技术文章 2015年 07月 02日
利用 InfoSphere BigInsights 中的 Big SQL 处理大数据
SQL 是一个实用查询语言,但它具有一定的局限性。Big SQL 让您能够在非表格式数据上运行复杂查询,并使用与 SQL 类似的语言查询它。Big SQL 的与众不同之处在于,您可以访问非表格式数据,并且这些数据实际上并不是以典型的 SQL 数据库结构为基础。使用 Big SQL,您可以导入和处理大量数据集,包括读取 InfoSphere BigInsights 中其他处理作业已处理的输出,将该信息转换为易于查询的数据。在本文中,我们探讨如何用 Big SQL 替代您现有的基础架构和查询,以及如何采用更复杂的查询并转换它们,以便利用您的 Big SQL 环境。
技术文章 2015年 07月 02日
使用 MapReduce 和 InfoSphere BigInsights 对各种文档类型进行处理和内容分析
企业通常需要分析各种文件类型的大量文档。Apache Tika 是一个免费的开源库,它从各种各样的文档格式(比如 Microsoft Word、RTF 和 PDF)中提取文本内容。了解如何在 InfoSphere BigInsights 内的 MapReduce 作业中运行 Tika,以便并行分析大量二进制文档。探索如何为了分析大量较小文件而优化 MapReduce。学习创建一个 Jaql 模块,让非 Java 编程人员可以使用 MapReduce 技术来运行可扩展的 MapReduce 作业,从而处理、分析和转换 Hadoop 内的数据。
技术文章 2015年 05月 12日
使用 InfoSphere BigInsights 分析社交媒体网站中的文本
了解如何利用 IBM 大数据平台提供的技术创建、测试、部署定制的文本提取器,并使用它们分析社交媒体数据和其他形式的文本。
技术文章 2015年 04月 15日
在 InfoSphere BigInsights 中利用与内存相关的参数提升 Big SQL 性能
了解如何针对 Big SQL 配置与内存相关的参数,从而提升 Big SQL 服务器的性能。对某些参数可以利用自动配置功能。
技术文章 2015年 03月 26日
用 Ganglia 监控基于 Biginsights 的 HBase 集群性能
随着数据爆发式增长时代的来临,各种云计算平台也不断的被推广出来。IBM 开发了 BigInsights 云计算平台,该平台包括 Hadoop 和 HBase 等底层开源项目,它可以帮助企业从大量的数据中挖掘出隐藏的商业价值。BigInsights 本身提供的监控信息并不能满足在高性能读写时用户所需要的各项监控指标。本文以车联网项目为背景,为了能够监控 HBase 集群在高并发的读写中各个节点上具体的性能指标,将 Ganglia 运用到集群监控,集成 HBase 本身提供的 GangliaMetrics,把 HBase 中除了系统资源以外直接能反应读写性能的指标通过 Ganglia 来展现,最终实现对 HBase 集群的全面监控。
技术文章 2015年 01月 26日
使用 Bluemix 分析服务执行文本分析
本教程将介绍如何使用 Analytics for Hadoop 和 Analytics Warehouse IBM Bluemix 服务执行文本分析。大多数过程都是在一个安装了 Eclipse IDE 和 BigInsights 插件的客户端机器上执行的。在提取了所需的文本之后,我们将在 Analytics Warehouse 中使用 R 来描绘结果图表。
技术文章 2014年 10月 09日
使用 IBM Big SQL over HBase,第 1 部分: 创建表和加载数据
利用 IBM 的 Big SQL 技术,您可以使用 InfoSphere BigInsights,通过行业标准的 SQL 来查询 HBase。本系列由两个部分组成,将会重点介绍创建表、数据加载方法和查询处理。在第 1 部分中,通过创建表和探讨加载数据的方式,我们将学习对 Hadoop over HBase 使用 IBM Big SQL 技术的基础知识。本文的基本思路是介绍如何使用 Big SQL 将关系表迁移到 HBase。第 2 部分将探讨查询处理,以及如何通过 JDBC 连接到 Big SQL,从而运行商业智能和报告工具,比如 BIRT 和 Cognos。
技术文章 2015年 03月 19日
IBM Big SQL 3.0 新功能系列,第一部分: 大规模并行处理 SQL 引擎(MPP SQL Engine)Big SQL 3.0 介绍
本文是 Big SQL 3.0 新功能系列的第一部分,主要介绍了 IBM BigInsights 3.0 新推出的 Big SQL 3.0 的相关功能,IBM Big SQL 3.0 是一个大规模并行处理 SQL 引擎(MPP SQL Engine),可以直接部署在物理的 HDFS 集群上。通过使用一个低延时并行执行基础架构,并将处理操作放在数据所在的节点,Big SQL 3.0 实现了 native 方式的 Hadoop 数据访问,包括读和写操作。
技术文章 2014年 08月 14日
从大数据源构建灵活的应用程序
绝大部分的大数据需求都来自于 Internet 技术的爆炸,这已经不是什么秘密。面向公众的应用程序可以拥有几百万用户,这个想法在 10-20 年前是闻所未闻的。如今,即使是一个普通网站,也可能拥有数百万用户,如果这些用户是活跃的,那么每天可能产生数百万个数据项。具有讽刺意味的是,创建大数据的基础架构和系统也可以反向工作,提供一些更好的方法来集成和使用该数据。有用的是,InfoSphere BigInsights 通过一个简单的 REST API 支持数据作业的管理和执行。通过 Jaql 接口,我们可以运行查询,并直接从 Hadoop 集群中获取信息。本文将重点介绍这些系统如何协同工作,为捕捉数据提供丰富的基础,并提供了一​​个用来再次备份信息的接口。
技术文章 2014年 03月 03日
开发一个大数据应用程序来执行数据探查和发现
探索大数据和传统企业数据是许多组织的共同需求。在本文中,我们概述了为通过基于 Hadoop 的平台管理的大数据建立索引的方法和指南,以便将这些数据用于数据发现解决方案。具体来讲,我们将介绍如何将存储在 IBM 的 InfoSphere BigInsights(一个基于 Hadoop 的平台)中的数据推送到 InfoSphere Data Explorer。InfoSphere Data Explorer 是一个复杂的工具,支持业务用户探查并组合来自多个企业和外部数据源的数据。
技术文章 2013年 09月 26日
分布式数据库 Hbase 的高可用管理和监控
HBase 作为 BigTable 的一个开源实现,随着其应用的普及,越来越被各大企业应用于海量数据系统中。本文将向读者简要介绍 Apache HBase 的基本知识,并展开介绍 IBM 对 HBase 的改进和扩展,HBase Master 多结点高可用支持,以及如何利用 IBM BigInsights 在 IBM Hadoop 集群中对 HBase 服务和作业提交进行监控和管理。本文将帮助读者在大数据云计算 Hadoop 集群应用中利用 HBase 更加高效、直观、便捷地进行存储,查询和优化海量数据。
技术文章 2013年 06月 13日
IBM Accelerator for Machine Data Analytics,第 4 部分: 加快多种数据的启动和运行体验
企业中产生的不同来源的机器日志的数量非常庞大。IBM Accelerator for Machine Data Analytics 简化了需要实现的任务,加速对半结构化、非结构化或结构化文本数据的分析。本文是该系列的第四篇文章,我们将在本文中分步了解如何在 IBM InfoSphere BigInsights 中使用 Web 或 Eclipse 工具让 IBM Accelerator for Machine Data Analytics 更快速地启动和运行。
技术文章 2013年 11月 01日
Flume NG:Flume 发展史上的第一次革命
Flume 作为 cloudera 开发的实时日志收集系统,已经受到越来越多的关注。比如 IBM BigInsights 已经将 Flume 作为产品的一部分。Flume 初始的发行版本目前被统称为 Flume OG(original generation),属于 cloudera。但随着 FLume 功能的扩展,Flume OG 代码工程臃肿、核心组件设计不合理、核心配置不标准等缺点暴露出来,尤其是在 Flume OG 的最后一个发行版本 0.94.0 中,日志传输不稳定的现象尤为严重,这点可以在 BigInsights 产品文档的 troubleshooting 板块发现。为了解决这些问题,2011 年 10 月 22 号,cloudera 完成了 Flume-728,对 Flume 进行了里程碑式的改动:重构核心组件、核心配置以及代码架构,重构后的版本统称为 Flume NG(next generation);改动的另一原因是将 Flume 纳入 apache 旗下,cloudera Flume 改名为 Apache Flume。本文将从基本组件以及用户体验的角度阐述 Flume OG 到 Flume NG 发生的革命性变化。
技术文章 2014年 04月 08日
适合大众的 BigSheets
第一次使用 IBM InfoSphere BigInsights 中的 BigSheets 技术时,您一定想知道该工具有过怎样的历史。BigSheets 为您带来了大数据,并使得大数据容易浏览、读取和识别。它还在您编写剖析您数据的更复杂查询和工具之前,为运行查询和识别模式提供了基础。本文展示了如何将分析的信息转换为可视化的信息,后者可用于构建和开发未来的查询和解决处理需求。
技术文章 2014年 07月 28日
更智能...: 赋予再生能源以重要性
位于丹麦奥胡斯的维斯塔斯风力系统公司使用 IBM InfoSphere BigInsights 对风速、气温、湿度、大气压以及降水等特定于位置的数据进行分析,以预测风力农场的性能。这有助于他们在最佳位置安装风力涡轮机,从而能以适中的价格转换能源,而同时又能保持最低的碳排放量。
技术文章 2011年 12月 13日
新闻: IBM Data Management 杂志 —— 2010 年第 3 期
了解最新的数据管理新闻,包括全新的 IBM pureScale Application System、Smart Analytics System、DB2 SQL Skin for Sybase ASE、新版 Informix、SPSS Decision Management 软件、 InfoSphere BigInsights、以及对 IDUG 的新认识。
技术文章 2010年 09月 09日
处理 Big SQL 扩展数据类型和复杂数据类型
Big SQL 是 InfoSphere BigInsights 中引入的一种 SQL 界面,可提供许多有用的扩展数据类型。通常,数据类型定义了所表示的值的属性集,这些属性描述了处理值的方式。Big SQL 支持一组丰富的数据类型,包括 Apache Hive 不支持的扩展数据类型。利用 Big SQL 支持的数据类型,可以更容易地表示和处理半结构化数据类型。使用本文中包含的代码样例和查询,了解如何使用 Big SQL 的简单和嵌套式复杂数据类型,以及如何在应用程序中创建和实现这些类型。作为一个新增的争议点,了解如何使用 Serializer Deserializer (SerDe) 来处理 JSON 数据。
技术文章 2014年 01月 02日
将 SPSS 分析技术应用于大数据
了解 SPSS 中处理大数据的新功能。现在可以对 SPSS 分析资产轻松地进行修改,以便连接到不同的大数据来源,它们还可以在不同的部署模式(批处理或实时模式)下运行。SPSS 平台的组件现在可与 IBM Netezza、InfoSphere BigInsights 和 InfoSphere Streams 结合使用,以支持分析师对大数据使用强大的分析工具。
技术文章 2014年 07月 31日
InfoSphere Streams 简介
了解 InfoSphere Streams,它是 IBM 大数据平台的一部分。InfoSphere Streams 解决了针对能够实时处理生成的海量流数据的平台和架构的一种迫切需求。了解该产品的设计目标,它适用于哪些时机,其工作原理,以及它如何为 InfoSphere BigInsights 提供补充来执行高度复杂的分析。
技术文章 2013年 07月 05日
通过 IBM InfoSphere Guardium 实现大数据安全性和审计
在本文中,您将学习 InfoSphere Guardium 如何提供数据库活动监控和审计功能,使您能够将 Hadoop 数据保护无缝地集成到现有企业数据安全策略中。您还将学习如何配置系统,以及如何使用 InfoSphere Guardium 安全策略和专为 Hadoop 环境定制的报告。您也将学习一个仅适用于 IBM InfoSphere BigInsights 的快速启动监控实现。
技术文章 2013年 03月 26日
Data Server Manager 警报功能简介
IBM ® Data Server Manager 为监控、管理和优化 IBM DB2® for Linux, Unix, and Windows, IBM DB2 for z/OS®和 IBM BigInsights® 提供了一个简单、可扩展和智能的解决方案,本文介绍了 IBM Data Server Manager 为 DB2 提供的各种警报功能,以帮助数据库管理员及其他 IT 人员可以有效监控、管理和优化其数据库系统。
技术文章 2016年 11月 21日
Big SQL 有何重要意义?
如果您专门研究过关系数据库管理技术,那么您或许听到过 “大数据” 和开源 Apache Hadoop 项目的许多信息。或许您还听说过 IBM 提供的新的 Big SQL 技术,该技术使 InfoSphere BigInsights 用户能够使用行业标准的 SQL 查询 Hadoop 数据。本文将介绍 Big SQL,回答关系 DBMS 用户拥有的许多关于这项 IBM 技术的常见问题。
技术文章 2013年 07月 29日
充分利用企业 Hadoop 的优势
MapReduce 实现是希望分析静止大数据的企业的首选技术。企业可以选择使用单纯的开源 MapReduce 实现(最著名的就是 Apache Hadoop),也可以选择使用商业实现。在这里,作者证明了以下情形:基于 Hadoop 的产品(比如 InfoSphere BigInsights)比不同的 Hadoop 更能满足企业需求。
技术文章 2013年 10月 24日
使用 IBM Big SQL over HBase,第 2 部分: 查询处理和商业智能报告
利用 IBM 的 Big SQL 技术,您可以使用 InfoSphere BigInsights,通过行业标准的 SQL 来查询 HBase。本系列由两个部分组成,将会重点介绍创建表、数据加载方法和查询处理。在第 1 部分中,通过创建表和探讨加载数据的方式,我们将学习对 Hadoop over HBase 使用 IBM Big SQL 技术的基础知识。在本文中,将了解查询处理,以及如何通过 JDBC 连接到 Big SQL,以便运行商业智能工具和报告工具,比如 BIRT 或 Cognos。
技术文章 2015年 03月 19日
针对职业高尔夫和网球赛的 Predictive Cloud Computing 项目,第 4 部分: 静止的大数据
本系列的第 4 部分首先简要概述了 IBM InfoSphere BigInsights 的总体功能。然后,我们讨论了一些具体的用例,以及 Predictive Cloud Computing (PCC) 如何使用 IBM InfoSphere BigInsights 分析大量的数据。最后,我们会演示 Flax 网络爬行器,在比赛活动过程中,会运行该爬行器为 BigInsights 的 Web 流量日志分析提供元数据。
技术文章 2016年 05月 23日
使用 Big SQL 和 Parquet 管理大数据
为您的开发场景选择最佳的文件格式,这可以帮助您提高性能。Apache Parquet 是一种列式存储文件格式,可用于 Hadoop 生态系统中的任何项目。Parquet 对复杂、嵌套的数据格式尤其有用,因为它支持高效的压缩和编码模式。学习如何将 Parquet 文件格式用于 IBM InfoSphere BigInsights Big SQL,查看体现其效率的一些示例。
技术文章 2015年 12月 22日
大数据治理系列,第六部分: 大数据监管和信息单一视图监管
本文主要介绍大数据治理统一流程参考模型第十二步“(狭义)大数据监管”、第十三步“信息单一视图监管”、IBM 大数据产品 BigInsights和Streams 以及 IBM 大数据治理方面的产品: InfoSphere DataStage、InfoSphere QualityStage。
技术文章 2015年 03月 05日
使用 R 从 JSON 中的数据中获取有意义的统计方法
本文将介绍如何使用 R 这种面向统计计算的语言集成 JavaScript Object Notation (JSON) 数据,比如 IBM InfoSphere BigInsights 产生的数据。本文还将介绍基本的 R 数据类型、命令和它的图形显示。
技术文章 2015年 02月 12日
使用 IBM Analytics for Hadoop 服务构建一个 Big SQL 应用程序
构建一个使用 IBM Analytics for Hadoop 服务的示例应用程序,该应用程序在一个基于云的 IBM InfoSphere BigInsights Enterprise Edition 实例上运行,将会分析社交媒体数据,以便了解 IBM Watson 品牌的全球普及范围。使用 Big SQL(IBM 基于 Hadoop 的平台 InfoSphere BigInsights 的 SQL 接口)查询数据,部署一个包含读取该数据的 Java 应用程序的 WAR 文件。为用户创建的示例应用程序可动态地对该数据运行查询。
技术文章 2015年 02月 05日
新闻: IBM Data Management 杂志,2011 年第 4 期
在这个广泛的主题总结中获取最新的 IBM 数据库消息,包括新版本的 IMS、IBM Netezza High Capacity Appliance、新的 Infosphere 版本、业务合作伙伴消息、认证,等等。
技术文章 2011年 12月 13日
探索高级分析平台,第 3 部分: 使用模式来分析非结构化文本
在本文中,您将学习如何使用设计模式来分析大数据上下文中的非结构化文本。由于解决该领域中的业务挑战通常需要多个任务,所以作者描述了用于架构解决方案的简单设计模式,解决方案使用非结构化文本文档中的数据。
技术文章 2014年 10月 30日
使用 Hadoop 和 Hive 获取机器数据
机器数据可能具有许多不同的格式和量。天气传感器、健康跟踪器,甚至是空调装置都会生成大量数据,它们需要一个大数据解决方案。但是,您如何确定哪些数据是重要数据,如何确定该信息有多大比例是有效的、值得包含在报告中或有助于检测警报条件?本文将介绍为大量机器数据集的使用提供支持的一些挑战,以及使用大数据技术和 Hadoop 的解决方案。
技术文章 2014年 07月 21日
创建 MapReduce 查询来处理特定类型的数据
MapReduce 处理为处理和构建不同类型的查询创建了一整套新范例和结构。然而,要最充分地利用 Hadoop,意味着要编写合适的 MapReduce 查询来处理信息。本文介绍许多不同的场景,其中包含如何开发不同类型的查询的食谱式示例。
技术文章 2014年 07月 10日
IBM Accelerator for Machine Data Analytics,第 3 部分: 加快机器数据搜索
企业中产生的不同来源的机器日志的数量非常庞大。IBM Accelerator for Machine Data Analytics 简化了需要实现的任务,加速了对半结构化、非结构化或结构化的文本数据的分析。
教程 2013年 01月 31日
IBM Accelerator for Machine Data Analytics,第 5 部分: 加速结构化数据与非结构化数据的分析
在本系列前面的文章中,为半结构化和非结构化数据创建了一个可搜索的存储库 — 这些数据包括 Apache Web 访问日志、WebSphere 日志、Oracle 日志和电子邮件数据。在本教程中,您将使用从客户数据库中导出的结构化数据来充实该存储库。具体来讲,您将同时搜索结构化客户信息,以及半结构化和非结构化的日志和电子邮件,使用 BigSheets 进行分析,以识别哪些在 7 月 14 日停电期间向 Sample Outdoors Company 发送电子邮件的客户比其他客户更忠诚。
教程 2013年 12月 24日
IBM Accelerator for Machine Data Analytics,第 1 部分: 加速机器数据分析
企业正在从各种来源生成大量机器日志。IBM Accelerator for Machine Data Analytics 简化了所需的实现任务,加快了对半结构化、非结构化或结构化文本数据的分析。
技术文章 2013年 06月 04日
最优细分方法和应用
了解特定于目标市场营销、产品开发以及剖析解决方案开发的集群、分类和细分技术。探讨流行细分方法和算法及其优势和局限性。
技术文章 2013年 03月 12日
在批发分销链中的哪一个环节开始执行数据挖掘
大型分销商为预测分析在分销领域的应用开辟了道路,使中等规模的分销商能够充分利用大型企业的成功和失败经验。在本文中,了解如何应用预测分析改善批发分销企业的多个职能部门的业务运营,并了解 IBM 产品集,包括对大数据技术的研究,以及随着技能和数据在未来的增长而对大数据技术的早期应用。
技术文章 2013年 02月 19日
视频、手机以及社交游戏货币化的大数据分析
应用大数据分析技术来捕获各种各样的行为和多结构游戏,以及玩家数据。然后,将该数据存储在 noSQL 数据库中,并将其与关系事务型数据库集成以通过深入且更多可行的洞察来获得激烈的竞争优势。
技术文章 2013年 01月 28日
开始参加大数据培训
了解目前可在 BigDataUniversity.com 上获得的免费的在线课程。按照建议的路径开始提升您的大数据知识,准备好实现它来满足您自己的业务需求。
技术文章 2012年 07月 30日
Bluemix 上的 Analytics for Hadoop,第 4 部分: Bluemix 上的 Analytics for Hadoop:使用 BigSheets 探究数据
使用 IBM BigSheets 应用程序立即分析和检查大数据,这个类似电子表格的工具可以建模、过滤、组合和绘制从多个来源收集的数据。
技术文章 2015年 01月 05日
使用 JAQL 语言读写大数据文件
对于初学 JAQL 语言的工程师来说,第一步是将文档读入 JAQL,只有将文件读取到 JAQL 程序,才能进行之后的步骤。而由于 JSON 文件可以包含不同格式的文档内容,选择正确的 JAQL 函数则是读取成功的关键。本文列举了不同的文件格式和如何使用不同的函数来读写这些文件,从而帮助初学者快速使用 JAQL 语言来进行开发。
技术文章 2016年 01月 05日
探索高级分析平台,第 5 部分: 深入剖析数据发现和可视化
本文将探讨一种数据湖探查模式,然后介绍执行跨端到端数据流的数据集成步骤。通过一系列探查用例,本文描述了探查的各种特征和执行模式。
技术文章 2015年 05月 06日
针对 Hadoop 的 SQL 访问的简单对比分析
尽管 Hadoop 通常被认为是大数据处理问题的一体适用的解决方案,但该项目管理大规模图形处理、流处理和结构化数据的可扩展处理的能力有限。了解 Big SQL,这是一个针对大规模结构化数据处理而优化的大规模并行处理 SQL 引擎。了解它与最近被引入用来提高 Hadoop 框架的大规模结构化数据处理效率的其他系统之间有何异同。
技术文章 2015年 04月 08日
第 1 - 72 条,共 72 条
显示内容简介 | 隐藏内容简介