跳转到主要内容

单击提交则表示您同意developerWorks 的条款和条件。 查看条款和条件.

这是您第一次登陆到 developerWorks,已经自动为您创建了您的概要文件。 选择您概要文件中可以公开的信息的信息(如姓名、国家/地区,以及公司),这些信息同时也会与您所发布的内容相关联。 您可以随时更新您的 IBM 账号。

所有提交的信息确保安全。

  • 关闭 [x]

当您初次登录到 developerWorks 时,将会为您创建一份概要信息,您需要指定一个昵称。您的昵称将和您在 developerWorks 发布的内容显示在一起。

昵称长度在 3 至 31 个字符之间。 您的昵称在 developerWorks 社区中必须是唯一的,并且出于隐私保护的原因,不能是您的电子邮件地址。

单击提交则表示您同意developerWorks 的条款和条件。 查看条款和条件.

所有提交的信息确保安全。

  • 关闭 [x]

IBM 大数据

IBM Big Data 基础知识

特别推荐

(新!)专题:IBM Data Management 中文通讯 - 大数据专栏

IBM Data Management 中文通讯 IBM 大数据专栏为我们提供了最全面、最新的大数据基础知识、产品技术及其行业解决方案的前沿技术内容。

大数据与 Hadoop

  • 结合使用 Hadoop 和 Couchbase
    尽管 Hadoop 非常适合用于处理大量数据,并将该信息解析为您可以查询的较小的信息集,但处理时间可能很长。但是,通过与 Couchbase Server 集成,您可以对信息执行实时查询和报告,同时继续使用 Hadoop 处理大型数据集和数据集的繁重处理工作。

  • 用 Big Data 挖掘新的业务洞察
    新兴的处理大量数据的能力引发了技术和业务领域的改变,本文介绍 Apache Hadoop 带给数据分析的动力、新局面和机遇。

  • Java 开发 2.0:NoSQL
    在 Web 2.0 时代,NoSQL 数据存储(比如 Bigtable 和 CouchDB)从边缘进入主流,因为它们能够解决伸缩性问题,而且能够大规模解决该问题。

  • “用 Hadoop 进行分布式数据处理”系列
    尽管 Hadoop 是一些大型搜索引擎数据缩减功能的核心部分,且搜索引擎需要收集数据,而且是数量极大的数据。作为分布式框架,Hadoop 让许多应用程序能够受益于并行数据处理。

  • Jaql 和 Pig 查询语言的比较
    Pig 是由 YaHoo! 发明的,已经贡献到 Apache 开源社区而且已经被很多公司在生产环境中应用。Jaql 是 IBM 实验室贡献的另外一种开源语言发布在 Google Code 上已经被多个项目所使用。

  • 使用 Apache Pig 处理数据
    Apache Pig 是一个高级过程语言,适合于使用 Hadoop 和 MapReduce 平台来查询大型半结构化数据集。通过允许对分布式数据集进行类似 SQL 的查询,Pig 可以简化 Hadoop 的使用。

  • Hadoop Distributed File System 简介
    HDFS 是 Apache Hadoop 项目的一个子项目,一个高度容错的分布式文件系统,设计用于在低成本硬件上运行。HDFS 提供高吞吐量应用程序数据访问功能,适合带有大型数据集的应用程序。

  • “用 Hadoop 进行分布式并行编程”系列
    Apache Pig 是一个高级过程语言,适合于使用 Hadoop 和 MapReduce 平台来查询大型半结构化数据集。通过允许对分布式数据集进行类似 SQL 的查询,Pig 可以简化 Hadoop 的使用。

IBM 大数据平台

  • 了解 InfoSphere BigInsights
    或许您听说过 InfoSphere BigInsights,它是 IBM 推出的用于储存和分析 “大数据” 的软件平台。

  • BigInsights -- 基于 Hadoop 的数据分析平台
    IBM InfoSphere BigInsights 大数据平台基于 Hadoop 技术,对数据查询语言,数据分析软件,数据库,作业调度模块进行了有效整合,实现了对数据的有效、高效处理,保证了高度的扩展性和兼容性。