最近在上hbase,数据是通过pentaho的数据集成工具spoon进入hbase的,这里还真是的感谢pentaho这家公司,他们这个工具真是神奇,就相当于spring,把所有的输出都整和进来了,包裹大数据这块,hadoop,hbase,hive等,周边系统。
我们就是要用spoon把数据从淘宝open平台拉下来写到hbase,然后通过MR做分析。但是pentaho最新的社区开源版本是4.4,
他集成的hadoop,hbase的版本都是偏低的。hadoop是。0.2.几的版本,hbase更是0.90.几的版本,所有跟我们搭建的集群就落后了。我们都是最新的版本,问题就来了,我们把zookeeper的集群地址做为参数是,spoon根本连不上,报什么
not a pair host:port,错误,后来发现连我自己的集群既然可,终于发现问题是zookeeper连上了。只是hbase在解析zookeeper上hbase注册的地址解析不对,导致的。所以你只要把pentaho集成的hbase版本替换回你所用的版本即可。
hbase在pentaho的插件目录下,路径为:E:\ETL\pdi-ce-4.4.0-stable\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations,这个目录下有4个文件,分别为cdh3,cdh4,这两个不用管,下面两个hadoop-20.,mapr,这两个目录下以及子目录,你会找到pentaho所集成的hbase的版本,你替换即可。就能通过pentaho写数据到hbase了。
相关推荐
NULL 博文链接:https://qq85609655.iteye.com/blog/2331671
关于eclipse集成pentaho 报表的一个小demo
[Packt Publishing] Pentaho 数据集成 初学者指南 第2版 (英文版) [Packt Publishing] Pentaho Data Integration Beginner's Guide 2nd Edition (E-Book) ☆ 图书概要:☆ Get up and running with the Pentaho ...
[Packt Publishing] Pentaho 3.2 数据集成 初学者指南 第1版 (英文版) [Packt Publishing] Pentaho 3.2 Data Integration Beginner's Guide 1st Edition (E-Book) ☆ 图书概要:☆ As part of Packt's Beginner's...
Pentaho数据集成 Pentaho数据集成(ETL)又名Kettle 项目结构 程序集:项目分发归档文件在此模块下生成 核心:核心实现 dbdialog:“数据库”对话框 ui:用户界面 引擎: PDI引擎 engine-ext: PDI引擎扩展 PDI核心...
赠送jar包:pentaho-aggdesigner-algorithm-5.1.5-jhyde.jar; 赠送原API文档:pentaho-aggdesigner-algorithm-5.1.5-jhyde-javadoc.jar; 赠送源代码:pentaho-aggdesigner-algorithm-5.1.5-jhyde-sources.jar; ...
[Packt Publishing] Pentaho 5.0 报表实例开发 初学者指南 (英文版) [Packt Publishing] Pentaho 5.0 Reporting by Example Beginner's Guide (E-Book) ☆ 图书概要:☆ Create high-quality, professional, ...
learning-pentaho-ctoolslearning-pentaho-ctoolslearning-pentaho-ctoolslearning-pentaho-ctoolslearning-pentaho-ctoolslearning-pentaho-ctoolslearning-pentaho-ctools
pentaho kettle中文开发手册
Pentaho Solutions Pentaho Solutions
解决 Cannot resolve org.pentaho:pentaho-aggdesigner-algorithm:5.1.5-jhyde jar放入D根目录执行: 以下命令加入本地maven库 mvn install:install-file -DgroupId=org.pentaho -DartifactId=pentaho-aggdesigner-...
以简单的方式将 PDI(Pentaho 数据集成)与 R 集成。 pdiR = PDI(Pentaho 数据集成)+ R 将 PDI(Pentaho 数据集成)与 R 结合使用的简单方法。 将 R 变成强大的 R Web 服务器。 在 PDI(Pentaho 数据集成)中...
博文链接:https://pikachu.iteye.com/blog/65266
Pentaho Data Integration(原Kettle)和 Data Reporting工具最新版9.0.0.2.530百度云下载地址 ETL工具及报表展示工具
org / pentaho / pentaho-aggdesigner-algorithm / 5.1.5-jhyde / pentaho-aggdesigner-algorithm-5.1.5-jhyde.jar,解决maven引入hive的jar包时依赖报错Could not find artifact org.pentaho:pentaho-aggdesigner-...
Pentaho笔记 3 2 使用MySQL作为Pentaho默认数据库 4 2.1 创建数据库 4 2.2 配置Pentaho 4 1配置Pentaho使用FoodMart数据 6 1.1注册数据源 6 1.2定义多维数据schema 7 1.3注册schema 7 1.4配置Pentaho使用filesystem-...
解决maven引入hive的jar包时依赖报错Could not find artifact org.pentaho:pentaho-aggdesigner-algorithm:pom:5.1.5-jhyde in xxx的问题,maven路径org/pentaho/pentaho-aggdesigner-algorithm/5.1.5-jhyde/pentaho...
Pentaho 数据集成 (PDI) 的 Docker 映像,也称为 Kettle,社区版。 它支持将 Carte 作为服务运行,或者将 Pan 或 Kitchen 作为批处理作业运行。 它还支持运行自定义脚本以完全自定义派生的 Docker 映像。 默认情况...