最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

GreenPlum 集群 gpfdist 实战

[复制链接]
跳转到指定楼层
楼主
发表于 2017-5-24 19:06:01 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
作者:黄杉


并行文件服务gpfdist组件模块,能够实现最大并行度、加载带宽,默认greenplum集群已经有了已经安装了gpfdist,但是如果在单独的服务器上,还是需要再次安装的单独的组件,需要下载一个loaders的组件安装包进行安装。



1,下载
下载地址:https://network.pivotal.io/produ ... 540/file_groups/561,选择和greenplumdatabase相同款的loaders,loaders里面包括有gpfdisk组件,下载显示如下:
C:\pic\greenplum\005.png


2,安装
基础组件
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
tar -xvf yaml-0.1.7.tar.gz
cd yaml-0.1.7
./configure                                                                             
make
make install
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
(1)解压缩
unzip greenplum-loaders-4.3.8.2-build-1-RHEL5-x86_64.zip                                          
(2)创建软件目录
mkdir /data/greenplum
chown -R gpadmin:gpadmin /data/greenplum
(3)开始安装
sh greenplum-loaders-4.3.8.2-build-1-RHEL5-x86_64.bin -y
(4)查看组件,可以看到gpfdist和gpload
[gpadmin@db_m2_slave1 ~]$ ll /data/greenplum/bin
total 756
drwxr-xr-x 4 gpadmin gpadmin   4096 May 10  2016 ext
-rwxr-xr-x 1 gpadmin gpadmin 663372 May 10  2016 gpfdist
-rwxr-xr-x 1 gpadmin gpadmin    311 May 10  2016 gpload
-rwxr-xr-x 1 gpadmin gpadmin 100338 May 10  2016 gpload.py                                 
[gpadmin@db_m2_slave1 ~]$


3,使用
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
启动命令:
nohup /data/greenplum/bin/gpfdist -d /home/gpadmin/ -p 8090 > /home/gpadmin/gpfdist.log  &
启动过程:
[gpadmin@db_m2_slave1 ~]$ nohup /data/greenplum/bin/gpfdist -d /home/gpadmin/ -p 8090 > /home/gpadmin/gpfdist.log  &
[1] 27003
[gpadmin@db_m2_slave1 ~]$
[gpadmin@db_m2_slave1 ~]$ more /home/gpadmin/gpfdist.log
2017-05-12 14:10:31 27003 INFO Before opening listening sockets - following listening sockets are available:
2017-05-12 14:10:31 27003 INFO IPV6 socket: [::]:8090
2017-05-12 14:10:31 27003 INFO IPV4 socket: 0.0.0.0:8090
2017-05-12 14:10:31 27003 INFO Trying to open listening socket:
2017-05-12 14:10:31 27003 INFO IPV6 socket: [::]:8090
2017-05-12 14:10:31 27003 INFO Opening listening socket succeeded
2017-05-12 14:10:31 27003 INFO Trying to open listening socket:
2017-05-12 14:10:31 27003 INFO IPV4 socket: 0.0.0.0:8090
Serving HTTP on port 8090, directory /home/gpadmin
[gpadmin@db_m2_slave1 ~]$


4,通过gpfdist服务建立的外部表
建立测试数据,准备2个txt数据,文件名字t01.txt/t02.txt
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
[gpadmin@db_m2_slave1 gpdextdata]$ pwd
/home/gpadmin/gpdextdata
[gpadmin@db_m2_slave1 gpdextdata]$ more t01.txt
1|aaa
2|zhangsan
[gpadmin@db_m2_slave1 gpdextdata]$ more t02.txt                                       
3|wanger
4|mazi
[gpadmin@db_m2_slave1 gpdextdata]$
在greenplum db上建立外部表,指向gpfdist服务的t01.txt、t02.txt数据,建立外部表的sql语句如下,在psql命令窗口上执行:
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
create external table public.t01_ext_1 (
id integer,
name varchar(128)
)
location (
/*'gpfdist://101.254.13.72:8090/gpextdata/test001.txt',
'gpfdist:// 101.254.3.72:8090/gpextdata/test002.txt'*/
/*'gpfdist:// 101.254.13.72:8090/gpextdata/*.txt'*/
'gpfdist://101.254.13.72:8090/gpextdata/t01.txt',
'gpfdist:// 101.254.13.72:8090/gpextdata/t02.txt'
)
Format 'TEXT' (delimiter as E'|' null as '' escape 'OFF')
--Encoding 'GB18030' Log errors into public.test001_err segment reject limit 10 rows               
;

执行过程:
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
(1)创建外部表成功:
yueworld_db=# create external table public.t01_ext_1 (
yueworld_db(# id integer,
yueworld_db(# name varchar(128)
yueworld_db(# )
yueworld_db-# location (
yueworld_db(# 'gpfdist://101.254.13.72:8090/gpextdata/t01.txt',
yueworld_db(# 'gpfdist:// 101.254.13.72:8090/gpextdata/t02.txt'
yueworld_db(# )
yueworld_db-# Format 'TEXT' (delimiter as E'|' null as '' escape 'OFF')                                 
yueworld_db-# ;
CREATE EXTERNAL TABLE
yueworld_db=#
yueworld_db=# select * from public.t01_ext_1;;
id | name
----+------
  1 | aaa
  2 | zhangsan
  3 | wanger
  4 | mazi
(4 rows)


yueworld_db=#


楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-6-20 20:20

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表