关于postgresql全文的信息

在 windows 上怎么使用 postgresql 全文索引

一、windows下安装过程安装介质：postgresql-9.1.3-1-windows.exe（46M），安装过程非常简单，过程如下： 1、开始安装： 2、选择程序安装目录：注：安装 PostgreSQL 的分区最好是 NTFS 格式的。

10年积累的网站设计制作、做网站经验，可以快速应对客户对网站的新想法和需求。提供各种问题对应的解决方案。让选择我们的客户得到更好、更有力的网络服务。我虽然不认识你，你也不认识我。但先网站制作后付款的网站建设流程，更有祥云免费网站建设让你可以放心的选择与我们合作。

postgreSQL的简单介绍？

postgreSQL是一款先进的开源数据库，拥有非常齐全的自由软件的对象-关系型数据库管理系统（ORDBMS），可面向企业复杂SQL的OLTP业务场景，支持多项企业级功能，能解决使用数据库的各种难题。

PostgreSQL的优势有很多。它是一个免费的对象-关系数据库服务器(ORDBMS)，在灵活的BSD许可证下发行。

postgreSQL的特征

函数：通过函数，可以在数据库服务器端执行指令程序。

索引：用户可以自定义索引方法，或使用内置的 B 树，哈希表与 GiST 索引。

触发器：触发器是由SQL语句查询所触发的事件。如：一个INSERT语句可能触发一个检查数据完整性的触发器。触发器通常由INSERT或UPDATE语句触发。多版本并发控制：PostgreSQL使用多版本并发控制（MVCC，Multiversion concurrency control）系统进行并发控制，该系统向每个用户提供了一个数据库的"快照"，用户在事务内所作的每个修改，对于其他的用户都不可见，直到该事务成功提交。

规则：规则（RULE）允许一个查询能被重写，通常用来实现对视图（VIEW）的操作，如插入（INSERT）、更新（UPDATE）、删除（DELETE）。

数据类型：包括文本、任意精度的数值数组、JSON 数据、枚举类型、XML 数据等。全文检索：通过 Tsearch2 或 OpenFTS，8.3版本中内嵌 Tsearch2。

NoSQL：JSON，JSONB，XML，HStore 原生支持，至 NoSQL 数据库的外部数据包装器。

数据仓库：能平滑迁移至同属postgreSQL生态的GreenPlum，DeepGreen，HAWK 等，使用 FDW 进行 ETL。

为什么选择PostgreSQL而不是MySQL

David Bolton是一名独立开发者，他使用PostgreSQL和MySQL都已有超过十年的时间。近日，他撰文阐述了选择PostgreSQL而不是MySQL的理由。他认为，MySQL之所以仍然如此流行是因为每个Linux Web托管软件包中都包含它。但随着Oracle将其收购，MySQL的开源程度大不如前。而PostgreSQL不仅发展更快，还加入了JSON支持，成为少数几个支持NoSQL的关系型数据库之一。

MySQL/MariaDB的当前版本是5.7.6（MariaDB为MySQL创建者Monty Widenius创建的一个MySQL分支），PostgreSQL的版本是9.4.1。Bolton从以下几个方面对比了两者的最新版本：

ANSI标准兼容性：与先前的版本相比，MySQL已经有了长足的进步，但MySQL背后的哲学是，如果客户喜欢，他们就会支持非标准扩展，而PostgreSQL从开始就将标准构建到平台里。不过，二者殊途同归，差别不大；

ACID遵从性：PostgreSQL有一个存储引擎，而MySQL有9个，但只有MyIsam和InnoDB与大部分用户有关，其中，后者为默认存储引擎。InnoDB和PostgreSQL都完全遵循ACID，差别不大；

无锁表修改：MyIsam使用表级锁来提升速度，这会导致写互斥。但PostgreSQL和InnoDB均使用行级锁，差别不大；

子查询：长期以来，这一直是MySQL的一个弱点，虽然5.6.5作了重大改进，但PostgreSQL对表连接支持得更好，尤其是MySQL不支持全外连接，因此，这方面PostgreSQL胜过MySQL；

JSON支持和NoSQL：PostgreSQL最近增加了JSON支持，与传统的关系型数据库相比，它提供了更大的数据存储灵活性，因此，这方面PostgreSQL胜过MySQL。

此外，Bolton指出，选择PostgreSQL还有如下理由：

更好的许可：PostgreSQL采用类似MIT的许可协议，允许开发人员做任何事情，包括在开源或闭源产品中商用，而MySQL的客户端遵循GPL许可协议，所以开发人员必须向Oracle付费或者将自己的应用程序开源；

更好的数据一致性： PostgreSQL会在数据插入和更新之前进行严格的验证，确保数据合法才会进行相应的操作，但在MySQL中，开发人员需要将服务器设定为严格SQL模式才能达到同样的目的，否则可能会产生不规范数据；

服务器扩展：MySQL提供了插件程序API，

支持C/C++或任何兼容C的语言，而且从5.7.3版本开始支持全文搜索，PostgreSQL有一个类似的系统但支持的语言更多，包括C/C++、

Java、.Net、Perl、

Python、Ruby、Tcl、ODBC等，它甚至可以在单独的进程中运行用户提供的代码；除了所有关系型数据库都包含的有关数据库、表和列的一般信息

外，PostgreSQL系统目录中还可以包含关于数据类型、函数和存取方法的信息，开发人员可以通过修改这些信息实现扩展。

PostgreSQL开源免费企业级数据库用着比较爽的地方有哪些？

1），PostgreSQL是通用型数据库。

PG有着丰富的数据类型（数值、字符、时间、布尔、货币、枚举、网络地址、JSONB等等）和索引类型（ B-tree、Hash、GiST、SP-GiST 、GIN 和 BRIN等）。可以存储和计算大多数场景的业务数据，如 ERP、交易系统、财务系统涉及资金、客户等信息，数据不能丢失且业务逻辑复杂，选择 PostgreSQL 作为数据底层存储，一是可以帮助您在数据一致性前提下提供高可用性，二是可以用简单的编程实现复杂的业务逻辑。适合各种OLTP和部分OLAP场景。

2），PostgreSQL数据库包含许多第三方插件。

如PostGIS等可以直接在数据库里进行地理位置相关的gis类存储和运算（LBS地理位置相关业务等O2O场景），其他的插件如Pg_stat_statements、uuid-ossp、pg_trgm、btree-gist插件、 pgcrypto加密等插件。

3），中小型企业快速搭建数据仓库和数据分析平台（TB级别）

PostgreSQL 提供丰富的数据类型和强大的计算能力，能够帮助您更简单搭建数据库仓库或大数据分析平台，为企业运营加分。

4），冷热分离

针对流水类的大表，PG可以使用分区表，线上保留热数据，历史数据存放在分区表里或者OSS等冷数据平台，冷热分离。

5），公有云支持度高如阿里云、腾讯云、华为云等公有云都有对应的RDS-PG产品，开箱即用，并提供技术支持。

OLTP：事务处理是PostgreSQL的本行

OLAP：ANSI SQL兼容，窗口函数，CTE，CUBE等高级分析功能，任意语言写UDF，citus分布式插件

流处理：PipelineDB扩展，Notify-Listen，物化视图，规则系统，灵活的存储过程与函数编写

时序数据：timescaledb时序数据库插件，分区表，BRIN索引

空间数据：PostGIS扩展（杀手锏），内建的几何类型支持，GiST索引。

搜索索引：全文搜索索引足以应对简单场景；丰富的索引类型，支持函数索引，条件索引

NoSQL：JSON，JSONB，XML，HStore原生支持，至NoSQL数据库的外部数据包装器

数据仓库：能平滑迁移至同属Pg生态的GreenPlum，DeepGreen，HAWK等，使用FDW进行ETL

postgresql 全文检索怎么按时间范围查询

select * from (select 除了时间所有字段写出来,to_date('COMMENTTIME','yyyy-mm-dd hh24:mi:ss') time from T_SCHOOL_RECORDCOMMENT where RECORDID = :p_cid) order by time desc; 这样试试，但是你的时间字段用该保存为date类型

PostgreSQL全文检索简介

PostgreSQL自带有一个简易的全文检索引擎，可以实现小规模数据量的全文检索功能。本文我们将引导介绍一下这个功能，对于小数据量的搜索这个功能是足够使用的，而无需搭建额外的ES等重量级的全文检索服务器。

PG的全文检索操作符是 @@ ，当一个 tsvector (文档)和 tsquery (条件)匹配时返回 true ，并且前后顺序无影响:

和普通的SQL查询一样，只要在 WHERE 条件中使用这个符号就代表使用全文检索条件筛选文档了。如:

@@ 操作符支持隐式转换，对于 text 类型可以无需强类型转换( ::tsvector 或 to_tsvector(config_name, text) )，所以这个操作符实际支持的参数类型是这样的:

tsquery 查询条件并不是简单的正则，而是一组搜索术语，使用并且使用布尔操作符（AND）、 | （OR）和 ! （NOT）来组合它们，还有短语搜索操作符 - （FOLLOWED BY）。更详细的语法参见此文档。

此外，PostgreSQL还提供了两个相对简化的版本 plainto_tsquery 和 phraseto_tsquery 。

plainto_tsquery ( plainto_tsquery([ config regconfig, ] querytext text) returns tsquery )用户将未格式化的 text 经过分词之后，插入符号转为 tsquery :

phraseto_tsquery ( phraseto_tsquery([ config regconfig, ] querytext text) returns tsquery )行为和 plainto_tsquery 行为类似，但是分词之后不是插入而是 - (FOLLOWED BY):

使用索引可以加快全文检索的速度。对于全文检索来说，可选的索引类型是 GIN (通用倒排索引)和 GIST (通用搜索树)，官方文档更推荐使用 GIN索引。创建一个 GIN 索引的范例:

也可以是一个连接列:

还可以单独创建一个 tsvector 列，为这个列创建索引:

除了普通的 ORDER BY 条件之外，PostgreSQL为全文检索提供了两个可选的排序函数 ts_rank([ weights float4[], ] vector tsvector, query tsquery [, normalization integer ]) returns float4 和 ts_rank_cd([ weights float4[], ] vector tsvector, query tsquery [, normalization integer ]) returns float4 ，以便实现基于权重的排序。

此外，对于PostgreSQL 9.6以上的版本还可以使用 RUM index 排序。(注意，这个是扩展，默认不包含)。

PostgreSQL默认的分词字典中并不包含中文分词字典，因此我们必须手工引入。目前一个比较好的项目是 zhparser ，同时这个插件也是阿里云的RDS默认包含的。安装和启用没什么好说的。值得一提的是分词配置参数。

在 CREATE EXTENSION 之后，必须配置分词参数才能正确进行分词和查找，否则什么都查不到。官方文档提供的一个配置策略是:

n,v,a,i,e,l 这几个字母分别表示一种token策略，只启用了这几种token mapping，其余则被屏蔽。具体支持的参数和含义可以用 \dFp+ zhparser 显示:

WITH simple 表示词典使用的是内置的simple词典，即仅做小写转换。根据需要可以灵活定义词典和token映射，以实现屏蔽词和同义词归并等功能。

比如我们看下面这个例子:

可以看到江淮这个词组在查询的时候被忽略了，我们启用 j (abbreviation,简称)再看看结果:

所以实际使用中要设置合理的token types，过少将导致搜索结果不准确，过多将导致性能下降。此外，还有一些诸如短词复合: zhparser.multi_short = f 这一类的控制分词结果的选项，根据实际使用酌情开启。

本文标题：关于postgresql全文的信息
文章源于：http://azwzsj.com/article/dsccsoo.html