character-varying vs character vs text

字符串类型

名字 描述
character varying(n), varchar(n) 变长,有长度限制
character(n), char(n) 定长,不足补空白
text 变长,无长度限制

类型区别

  • SQL定义了两种基本的字符类型:character varying(n)character(n),这里的n是一个正整数。两种类型都可以存储最多n个字符的字符串。 试图存储更长的字符串到这些类型的字段里会产生一个错误, 除非超出长度的字符都是空白,这种情况下该字符串将被截断为最大长度。
    • varchar(n)char(n)分别是character varying(n)character(n)的别名。

    • 如果要存储的字符串比声明的长度短,类型为character的数值将会用空白填满; 而类型为character varying的数值将只是存储短些的字符串。

    • 如果我们明确地把一个数值转换成character varying(n)character(n),那么超长的数值将被截断成n 个字符,且不会抛出错误。这也是SQL标准的要求。

    • 没有声明长度的character等于character(1), 如果不带长度使用character varying, 那么该类型接受任何长度的字符串。后者是PostgreSQL的扩展。

    • character类型的数值物理上都用空白填充到指定的长度n, 并且以这种方式存储和显示。不过,在比较两个character 类型的值时,尾随的空白不需要理会。 在空白比较重要的排序规则中,这个行为会导致意想不到的结果, 比如SELECT 'a '::CHAR(2) collate "C" < 'a\n'::CHAR(2)返回true。 在将character值转换成其它字符串类型的时候, 它后面的空白会被删除。请注意, 在character varyingtext数值里, 结尾的空白是有语意的。 并且当使用模式匹配时,如LIKE,使用正则表达式。

官方提示

  • 三种类型没有性能差别,除了当使用填充空白类型时的增加存储空间和当存储长度约束的列时一些检查存入时长度的额外的CPU周期。 某些其它的数据库系统里,character(n) 有一定的性能优势,但在PostgreSQL里没有。 事实上,character(n)通常是这三个中最慢的, 因为额外存储成本。在大多数情况下,应该使用text 或character varying。

  • 不管怎样,允许存储的最长字符串大概是1GB 。允许在数据类型声明中出现的n 的最大值比这还小。修改这个行为没有什么意义,因为在多字节编码下字符和字节的数目可能差别很大。 如果你想存储没有特定上限的长字符串,那么使用text 或没有长度声明的character varying,而不要选择一个任意长度限制。

使用

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
CREATE TABLE test1 (a character(4));
INSERT INTO test1 VALUES ('ok');
SELECT a, char_length(a) FROM test1; -- (1)
a | char_length
------+-------------
ok | 2

CREATE TABLE test2 (b varchar(5));
INSERT INTO test2 VALUES ('ok');
INSERT INTO test2 VALUES ('good ');
INSERT INTO test2 VALUES ('too long');
ERROR: value too long for type character varying(5)
INSERT INTO test2 VALUES ('too long'::varchar(5)); -- 明确截断
SELECT b, char_length(b) FROM test2;
b | char_length
-------+-------------
ok | 2
good | 5
too l | 5

postgresql字符串类型比较,参考:
https://www.postgresql.org/docs/9.1/datatype-character.html
http://www.postgres.cn/docs/9.4/datatype-character.html