此您可以在网上获得很多社区支持。 文章标签: 语言深入研究大数据的巨人!探索 Hadoop,这是一个开源框架,可以跨计算机集群处理大量数据集,重塑现代数据处理。 阅读时间:10分钟 BairesDev 编辑团队 作者:BairesDev 编辑团队 BairesDev 是一家屡获殊荣的近岸软件外包公司。
我们拥有 多名工程师
和专家,精通数百种技术。 什么您的公司从事数 荷兰资源 字处理业务吗?您需要对大量数据进行计算吗?如果是这样,您很可能需要分布式计算来进行类似大数据的交易。您如何实现这一壮举?借助 Hadoop。 Apache Hadoop 是一套开源工具,它能够将多台计算机集群在一起来解决大问题。
用于存储几乎所有类
型的数据,并为几乎无限的并发作业提供强 通常不知道如何与父母 大的处理能力。 项目上工作时创立。该项目启动后不久,Cutting 和 Cafarella 就得出结论,单是硬件成本就将近 50 万美元,每月运行成本约为 3 万美元。
为了降低成本团队转
限于 20-40 个节点集群。这意味着他们 新加坡数据 无法仅靠 2 个人从事该项目来实现目标。意识到这一点后不久(Cutting 加入了 Yahoo!),一个名为 Hadoop 的新项目应运而生,旨在扩展 Nutch 扩展 1000 个节点的能力。