PostgreSQL中使用dblink实现跨库查询的方法

最近一个sql语句涉及到跨库的表之间的联合查询,故研究学习下。

一开始研究知道了sql语句的写法,但是执行通过不了,需要先安装dblink扩展。这些博文里都没说清楚,感谢网友指点,在windows下只需要在相应的数据库下执行sql语句“create extension dblink”就ok了。而以上的博文基本上说的都是linux下的操作方法,也因此我走了弯路。

2.下载了PostgreSQL的源代码,却不知道语句在哪执行,貌似是在linux下的shell里执行的,我却在psql和cmd里都试过,都是走过的弯路啊。也尝试过直接拷贝dblink.sql里的语句运行,却通不过报错。

PostgreSQL中使用dblink实现跨库查询的方法

3.windows下很简单,一句sql就搞定了“create extension dblink”.
在扩展里可以看到多了一个dblink:

PostgreSQL中使用dblink实现跨库查询的方法

函数里也相应的有了dblink开头的一些函数:

PostgreSQL中使用dblink实现跨库查询的方法

这句sql语句貌似只调用运行了dblink.control文件:

PostgreSQL中使用dblink实现跨库查询的方法

3.写sql语句测试下,是否ok。

跨库查询,先要建立数据库连接,才能查询否则会报错。

如图是提示的connection named"unnamed",因为有其他的连接,如果没有任何连接,则会提示connection not available:

PostgreSQL中使用dblink实现跨库查询的方法

使用dblink(text,text),第一个参数是连接串,第二个参数是sql语句。执行成功:

PostgreSQL中使用dblink实现跨库查询的方法

或者使用dblink_connect(text)先建立连接,再用dblink(text)做跨库查询:

PostgreSQL中使用dblink实现跨库查询的方法

查看连接:

select dblink_get_connections()

断开所有连接:

select dblink_disconnect()

断开指定名称的连接:

select dblink_disconnect('test')

如之前建立过名为‘test'的连接:

select dblink_connect('test','host=localhost dbname=cbe_sta user=postgres password=lifc126820');

则会提示断开成功。

4.最后,我自己需要的sql语句也ok了,在同一个服务器上的两个数据库3张表的联合查询,先建立连接再做查询:

select dblink_connect('host=localhost dbname=cbe_userdata user=postgres password=lifc126820');

select A.id,A.code as poicode,A.cname,A.geo,A.x,A.y,A.s01,A.s02,A.s03,A.updatetime,A.tbcode,D.code,D.data,D.value,D.cname as colname,D.ifdata,D.sort from tb_test_poi A inner join ((select * from dblink('select poicode,code,data,value from tb_test_data_poi') as T1(poicode character varying(50),code character varying(50),data double precision,value character varying(500))) B inner join (select * from dblink('select cname,code as code1,ifdata,sort from tb_test_index_poi') as T2(cname character varying(200),code1 character varying(50),ifdata character varying(5),sort character varying(50))) C on B.code=C.code1) D on A.code=D.poicode;

如果做成视图也行,这里就需要用dblink(text,text),如果直接用上面的sql语句会报错说无法建立连接:

CREATE OR REPLACE VIEW vw_test_poi AS
 SELECT a.id, a.code AS poicode, a.cname, a.geo, a.x, a.y, a.s01, a.s02, a.s03,
  a.updatetime, a.tbcode, d.code, d.data, d.value, d.cname AS colname,
  d.ifdata, d.sort
  FROM tb_test_poi a
  JOIN (( SELECT t1.poicode, t1.code, t1.data, t1.value
      FROM dblink('host=localhost dbname=cbe_userdata user=postgres password=lifc126820'::text, 'select poicode,code,data,value from tb_test_data_poi'::text) t1(poicode character varying(50), code character varying(50), data double precision, value character varying(500))) b
  JOIN ( SELECT t2.cname, t2.code1, t2.ifdata, t2.sort
      FROM dblink('host=localhost dbname=cbe_userdata user=postgres password=lifc126820'::text, 'select cname,code as code1,ifdata,sort from tb_test_index_poi'::text) t2(cname character varying(200), code1 character varying(50), ifdata character varying(5), sort character varying(50))) c ON b.code::text = c.code1::text) d ON a.code::text = d.poicode::text;

我发觉执行效率有点慢啊,查出来的数据是1万多条,用了2秒多。目前我的程序里并没有用dblink来做,因为输入参数可以先单独查一张表即可,然后给另外两张表的信息关联查询上ok了,所以我分两步来做了,解决了这个问题。具体效率未深入对比,如果后期需要调整,可以考虑用dblink来做,这样毕竟程序里代码会简单很多。

相关推荐