云计算技术频道 - 红黑联盟

大数据架构的典型方法和方式

大量的IT组织如今都已自己的数据架构，因为都依赖于传统的数据架构。处理多数据源已不再新鲜；这些架构已经连接了多维度的数据源例如 CRM 系统，文件系统和其他商用系统。主要运行的关系型数据库有 Oracle, DB2和Microsoft SQL。

关键词：架构典型方式方法数据

基于HBase的冠字号查询系统2--实现

基于HBase的冠字号查询系统2--实现部分。

关键词：查询系统字号部分

ElasticSearch（七）--请求

简单查询lite search （字符串查询）是一种有效的命令行ad hoc 查询，但是想要善用搜索，必须使用请求体查询request body search API．之所以这么称呼，是因为大多数的参数以JSON格式所容纳，而不是查询字符串．

关键词：

Openstackliberty源码分析

接上篇Openstack liberty源码分析之云主机的启动过程2, 简单回顾下：nova-conductor收到nova-scheduler返回的主机列表后，依次发送异步rpc请求给目标主机的nova-compute服务，下面继续来看nova-compute服务的处理过程

关键词：源码过程主机

Akka并发编程——第六节：Actor模

本将主要内容：1 !消息发送，Fire-and-Forget消息模型;2 ？消息发送，Send-And-Receive-Future消息模型

关键词：模型第六节

Spark算子相关知识详细介绍

RDD算子分类，大致可以分为两类，即：Transformation：转换算子，这类转换并不触发提交作业，完成作业中间过程处理。Action：行动算子，这类算子会触发SparkContext提交Job作业。

关键词：算子知识

flume简介与监听文件目录并sink至

flume 作为 cloudera 开发的实时日志收集系统，受到了业界的认可与广泛应用。Flume 初始的发行版本目前被统称为 Flume OG（original generation），属于 cloudera。但随着 FLume 功能的扩展，Flume OG 代码工程臃肿、核心组件设计不合理、核心配置不标准等缺点暴露出来

关键词：实战文件目录简介

R 函数相关基础知识参考

帮助和基础；大部分 R 函数都有在线文档。help(topic) 关于 topic 的文档 ?topic 同上help search( "topic ") 搜索帮助系统

关键词：基础知识函数

解析 Ceph : OSD , OSDM

Ceph致力于提供PB级的集群存储能力，并且提供自动故障恢复，方便的扩容和缩容能力，这些能力在典型的分布式存储系统就需要 Metadata Server 来提供，因为完全分布式系统对于数据迁移和扩容有着非常强的痛点，但是 Metadata Server 另一方面又需要避免单点故障和数据瓶颈的问

关键词：

深度学习与自然语言处理(1)_斯坦福cs

这是本课程的第一节，我们会先介绍自然语言处理（NLP）的概念和NLP现在所面对问题；然后开始讨论用数学向量代表自然语言词组的设想。最后我们会讨论现行的词向量构造方法。

关键词：斯坦福自然语言深度

cephosdmapcrush分析

map增量更新,只描述变化信息,通常是一个或多个节点错误或恢复间隔比较长的map,将多个跟新捆绑一次更新将压力转移到OSD间通信,OSD和client通讯,OSD自己相互更新map。

关键词：

02-Hive一个表创建另一个表，表分区

02-Hive一个表创建另一个表，表分区，分桶。

关键词：

hive高阶1--sql和hive语句执

hive高阶1--sql和hive语句执行顺序、explain查看执行计划、groupby生成MR。

关键词：高阶语句顺序

Java接入Spark之创建RDD的两种

Java接入Spark之创建RDD的两种方式和操作RDD。首先看看思维导图，我的spark是1 6 1版本，jdk是1 7版本。

关键词：方式

使用map端连接结合分布式缓存机制实现J

使用map端连接结合分布式缓存机制实现Join算法。前面我们介绍了MapReduce中的Join算法，我们提到了可以通过map端连接或reduce端连接实现join算法，在文章中，我们只给出了reduce端连接的例子，下面我们说说使用map端连接结合分布式缓存机制实现Join算法。

关键词：分布式缓存算法机制

第8课：SparkStreaming源码

第8课：SparkStreaming源码解读之RDD生成全生命周期彻底研究和思考。从整个sparkstreaming角度来考虑，rdd分为三个方面的内容。

关键词：源码周期生命

nova boot代码流程分析(三)：

在执行nova boot命令创建VM时，neutron将会为VM分配MAC和IP，用于创建VM所需的port。网上有些许相关讲述nova与neutron交互的文章，不过都是从架构层面进行分析和讲解，很少涉及到代码层面。

关键词：流程代码

机器学习笔记——矩阵分析与应用

机器学习笔记——矩阵分析与应用。第三讲依然是数学，因为数学是解决一切问题的基础，一个问深入到最后都是数理知识的支撑。所谓基础决定上层建筑，比如参加ACM比赛，高手之间的比赛已经不是编程技巧了，更多的是数学知识的比拼。

关键词：机器学习机器学习技术矩阵分析矩阵利用技巧

记一下机器学习笔记 Rosenblatt

记一下机器学习笔记 Rosenblatt感知机，这里主要是《神经网络与机器学习》（Neural Networks and Learning Machines，以下简称《神机》）的笔记，以及一些周志华的《机器学习》的内容，可能夹杂有自己的吐槽，以及自己用R语言随便撸的实现。

关键词：机器学习机器学习技术 Rosenblatt感知机

梯度下降法及其Python实现

梯度下降法（gradient descent），又名最速下降法（steepest descent）是求解无约束最优化问题最常用的方法，它是一种迭代方法，每一步主要的操作是求解目标函数的梯度向量，将当前位置的负梯度方向作为搜索方向（因为在该方向上目标函数下降最快，这也是最速下降法名称的由

关键词：梯度