OracleVM+centos7 1+openstackkilo多结点安装教程---neutron的安装(2)。声明:最近在进行openstack的kilo版本的安装,发现现有的网络教程非常少,而且多数教程并不能安装成功,故写此教程。openstack的安装较为复杂,本教程并不能保证在不同环境下也能将其安装成功。
OracleVM+centos7 1+openstackkilo多结点安装教程---neutron的安装(3)。声明:最近在进行openstack的kilo版本的安装,发现现有的网络教程非常少,而且多数教程并不能安装成功,故写此教程。
Spark版本定制版3-通过案例对SparkStreaming透彻理解三板斧之三。本讲内容基于Spark 1 6 1版本(在2016年5月来说是Spark最新版本)讲解。
Hadoop学习之网络爬虫+分词+倒排索引实现搜索引擎案例。
ElasticSearch(三)--文档。面向对象编程语言流行的原因之一是,可以用对象表示和处理现实生活中那些有潜在关系和复杂结构的实体.到目前为止,这种方式还不错。
HiveQL基本操作整理。
在Kaggle手写数字数据集上使用SparkMLlib的朴素贝叶斯模型进行手写数字识别。
Hadoop之仿写搜索引擎。这篇文章,可能比较长,如果你觉得写得好可以把它看完,希望对你有所帮助。
HadoopJoin。Reduce端join,适合于两个大表 Map端join,适合一个大表和一个小表,小表放到 Distribute Cache里面 semi join 当join只用到其中一个表中的一小部分时。
MapReduce中的join算法-reduce端join。在海量数据的环境下,不可避免的会碰到join需求, 例如在数据分析时需要连接从不同的数据源中获取到数据。假设有两个数据集:气象站数据库和天气记录数据库,并考虑如何合二为一。
Java中Comparable和Comparator的辨析。在对集合元素进行比较时一般使用TreeSet。对于简单的数据类型,TreeSet可以直接进行比较。但是对于复杂的数据类型,比如自己定义的数据类型或者类,就需要自己设置比较方法与比较规则了,这时就需要用到Comparable和Comparator了。
windows下pycharm开发spark。
ganglia集群的搭建与hadoop集群的搭建。Ganglia是UCBerkeley发起的一个开源监视项目,设计用于测量数以千计的节点。每台计算机都运行一个收集和发送度量数据(如处理器速度、内存使用量等)的名为gmond的守护进程。
Java核心技术(六)——接口。后面的博文,我们将开始Java的常用高级技术学习。接口技术,主要用来描述类具有什么样的功能,而并不给出每个功能的具体实现。一个类可以实现(implement)一个或多个接口,并在需要接口的地方,随时使用实现了相应接口的对象。
tomcat启动时候报错java lang ClassCastException。
参考资源限制方法两种。资源限制针对 docker daemon ( 不针对 contrainer )。资源限制针对 docker contrainer (针对 contrainer 及 contrainer 下所有的进程 )。
Kafka的安装及测试。
第93讲:SparkStreamingupdateStateByKey案例实战和内幕源码。第一部分:updateStateByKey它的主要功能是随着时间的流逝,在Spark Streaming中可以为每一个key可以通过CheckPoint来维护一份state状态,通过更新函数对该key的状态不断更新。
蜂巢之Iaas云主机快速启动的优化。使用过Linux的,不使用桌面的技(无)术(限)大(装)拿(X)的筒子们大概都有经验,电脑的操作启动时间是速度很快的,往往都是在几秒级别完成。
是一个简单的beat,检索tomcat jmx中的指标值的工具。检索出的数据提供给LogStash或者Elasticsearch呈现。jmx指标是通过在tomcat中配置“JMX Proxy Servlet“, 并可通过http请求获取。