云计算技术频道 - 红黑联盟

云计算之ceph相关知识

您可以存储的总数据容量和对象个数不受限制。各个 Amazon S3 对象的大小范围可以从最小 0 字节到最大 5 TB。可在单个 PUT 中上传的最大数据元为 5 GB。对于大于 100 MB 的数据元，客户应该考虑使用分段上传功能。

关键词：知识

??Hadoop是Apache软件基金会旗下的一个开源的分布式计算平台。以Hadoop分布式文件系统（Hadoop Distributed File System， HDFS）和MapReduce（Google MapReduce的开源实现）为核心的Hadoop为用户提供了系统底层细节透明的分布式基础架构。

关键词：示例简介

Java使用JDBC连接Hive（新版本

网上找了很多封装的API,发现都是过时了的，运行报各种错误，经过了几天的调错，终于可以使用java代码操作hive了

关键词：

Hive安装配置详解

1 安装MySQL:sudo apt-get install mysql-server mysql-client

关键词：

hadoop进阶系列之海量web日志KP

hadoop进阶系列之海量web日志KPI指标提取。1：Web日志分析系统概述；2：需求分析：日志提取预处理，KPI指标设计，存储与展现。

关键词：进阶海量指标日志

MapReduce中的Join算法

在关系型数据库中Join是非常常见的操作，各种优化手段已经到了极致。在海量数据的环境下，不可避免的也会碰到这种类型的需求，例如在数据分析时需要从不同的数据源中获取数据。不同于传统的单机模式，在分布式存

关键词：算法

Hadoop2.2.0伪分布式之MapR

mapReduce是分布式计算模型。注：在hadoop2 x中MapReduce运行在yarn上，yarn支持多种运算模型。storm、spark等等，任何运行在JVM上的程序都可以运行在yarn上

关键词：分布式简介

第10课：SparkStreaming源

第10课：SparkStreaming源码解读之流数据不断接收全生命周期彻底研究和思考。1。数据接收架构设计模式；2。数据接收源码彻底研究

关键词：源码周期不断生命数据

spark-streaming入门（二）

input DStreams指的是从输入源获取的输入流数据。在之前的例子中，lines 就是input DStream 因为他表示从netcat服务器获取的数据流。每个input DStream(除了文件系统以外，在后面的章节中介绍)与一个Receiver对象相关联

关键词：

Openstackliberty源码分析

nova-api通过rpc发送启动云主机请求后，nova-conductor会收到该请求，根据路由映射，该请求会递交给。nova conductor manager py ComputeTaskManager build_instances处理，如下（函数说明见注释）

关键词：源码过程主机

THUCTC源码解读(四)

LiblinearTextClassifier 我认为LiblinearTextClassifier是整个分类器中最核心的模块，实现了训练，分类等功能。 LiblinearTextClassifier实现的是TextClassifier的接口，实现了TextClassifier中定义的 ad

关键词：源码

CloudCore引领核心网云化转型

CloudCore引领核心网云化转型。2015年7月，全球著名咨询公司IHS Infonetics发布最新NFV（Network Functions Virtualization，网络功能虚拟化）市场调研报告。

关键词： CloudCore 核心网云化转型网络功能虚拟化

Bloomfilter(布隆过滤器)概念

在大数据与云计算发展的时代，我们经常会碰到这样的问题。我们是否能高效的判断一个用户是否访问过某网站的主页（每天访问量上亿）或者需要统计网站的pv、uv。最直接的想法是将所有的访问者存起来，然后每次用户访问的时候与之前集合进行比较。

关键词：布隆过滤器原理概念

关于StormTick的定时机制——ti

Apache Storm中内置了一种定时机制——tick，它能够让任何bolt的所有task每隔一段时间（精确到秒级，用户可以自定义）收到一个来自__systemd的__tick stream的tick tuple，bolt收到这样的tuple后可以根据业务需求完成相应的处理。

关键词：机制

Hadoop开发环境搭建

之前稍微了解了一下大数据方面的知识，在搭建环境的时候我很惆怅的，因为那时候没有弄好，刚好这几天有时间，于是把以前没有弄好的又来配置了一下，没想到居然成功了，这个过程走了很多的弯路，查阅了网上大量

关键词：环境

Spark定制版：008~SparkSt

本讲内容：a DStream与RDD关系的彻底的研究;b Streaming中RDD的生成彻底研究。本讲内容基于Spark 1 6 1版本(在2016年5月来说是Spark最新版本)讲解。

关键词：源码周期生命

NoSQL与大数据

概览一下大数据项目中可以使用的数据存储技术，聚焦于Couchbase 和 ElasticSearch，展示如何使用以及它们的区别，先理解一下NoSQL领域中各种不同的技术。 NoSQL 关系型数据库是过去的选择，几乎是许多开发

关键词：数据

neutron-dhcp-agent服务

在分析nova boot创建VM的代码流程与neutron-dhcp-agent交互之前，首先分析neutron-dhcp-agent服务启动流程。与其他服务的启动入口一样。查看setup cfg文件。 [entry_points] console_scripts = neutr

关键词：流程

Hadoop2.2.0伪分布式搭建简述

简述了自己搭建Hadoop伪分布式的过程，方便以后查看参考。环境：Vmware10& 43;RedHat6 3& 43;hadoop2 2 0& 43;JDK1 7 Hadoop模式：本地模式：只能其一个reduce和一个map，用于调试伪分布式模式：通过一台机

关键词：分布式

Hadoop之集群模式搭建

集群规划主机名 ip 安装的软件进程 hadoop01 192 168 1 101 jdk、hadoop NN、DFSZKFailoverController hadoop02 192 168 1 102 jdk、hadoop NN、DF

关键词：集群模式