9.8. 数据类型格式化函数

PostgreSQL 格式化函数提供一套有效的工具用于把各种数据类型转换成格式化的字符串以及反过来从格式化的字符串转换成指定的数据类型。表9-20列出了这些函数。这些函数都遵循一个公共的调用习惯:第一个参数是待格式化的值,而第二个是定义输出或输出格式的模板。

to_timestamp 函数也能接受一个 double precision 参数,把它从 Unix 纪元转换成 timestamp with time zone。Integer 类型的 Unix 纪元隐含地转换成了 double precision 。

表9-20. 格式化函数函数 返回类型 描述 例子
to_char(timestamp, text) text 把时间戳转换成字符串 to_char(current_timestamp, 'HH12:MI:SS')
to_char(interval, text) text 把时间间隔转为字符串 to_char(interval '15h 2m 12s', 'HH24:MI:SS')
to_char(int, text) text 把整数转换成字符串 to_char(125, '999')
to_char(double precision, text) text 把实数/双精度数转换成字符串 to_char(125.8::real, '999D9')
to_char(numeric, text) text 把数字转换成字符串 to_char(-125.8, '999D99S')
to_date(text, text) date 把字符串转换成日期 to_date('05 Dec 2000', 'DD Mon YYYY')
to_number(text, text) numeric 把字符串转换成数字 to_number('12,454.8-', '99G999D9S')
to_timestamp(text, text) timestamp with time zone 把字符串转换成时间戳 to_timestamp('05 Dec 2000', 'DD Mon YYYY')
to_timestamp(double precision) timestamp with time zone 把 UNIX 纪元转换成时间戳 to_timestamp(200120400)


在输出模板字符串里(对 to_char 而言),该函数族可以识别一些特定的模式,并且把待格式化的数值正确地格式化成相应的数据。任何不属于模板模式的文本都简单地逐字拷贝。同样,在一个输入模板字符串里(对除 to_char 外的任何东西),模板模式标识要查看的输入数据字符串,并且将在该位置寻找数值。

表9-21显示了可以用于格式化日期和时间值的模版。

表9-21. 用于日期/时间格式化的模式模式 描述
HH 一天的小时数(01-12)
HH12 一天的小时数(01-12)
HH24 一天的小时数(00-23)
MI 分钟(00-59)
SS 秒(00-59)
MS 毫秒(000-999)
US 微秒(000000-999999)
SSSS 午夜后的秒(0-86399)
AM 或 A.M. 或 PM 或 P.M. 上下午标识(大写)
am 或 a.m. 或 pm 或 p.m. 上下午标识(小写)
Y,YYY 带逗号的年(4 和更多位)
YYYY 年(4 和更多位)
YYY 年的后三位
YY 年的后两位
Y 年的最后一位
IYYY ISO年(4 位或更多位)
IYY ISO年的最后三位
IY ISO年的最后两位
I ISO年的最后一位
BC 或 B.C. 或 AD 或 A.D. 纪元标识(大写)
bc 或 b.c. 或 ad 或 a.d. 纪元标识(小写)
MONTH 全长大写月份名(空白填充为 9 字符)
Month 全长混合大小写月份名(空白填充为 9 字符)
month 全长小写月份名(空白填充为 9 字符)
MON 大写缩写月份名(3 字符)
Mon 混合大小写缩写月份名(3 字符)
mon 小写缩写月份名(3 字符)
MM 月份数(01-12)
DAY 全长大写日期名(空白填充为 9 字符)
Day 全长混合大小写日期名(空白填充为 9 字符)
day 全长小写日期名(空白填充为 9 字符)
DY 缩写大写日期名(3 字符)
Dy 缩写混合大小写日期名(3 字符)
dy 缩写小写日期名(3 字符)
DDD 一年里的日(001-366)
DD 一个月里的日(01-31)
D 一周里的日(1-7 ;周日是 1)
W 一个月里的周数(1-5)(第一周从该月第一天开始)
WW 一年里的周数(1-53)(第一周从该年的第一天开始)
IW ISO一年里的周数(第一个星期四在第一周里)
CC 世纪(2 位)(20 世纪从 2001-01-01 开始)
J 儒略日(自公元前 4712 年 1 月 1 日来的天数)
Q 季度
RM 罗马数字的月份(I-XII ;I=JAN)(大写)
rm 罗马数字的月份(I-XII ;I=JAN)(小写)
TZ 时区名(大写)
tz 时区名(小写)


有一些修饰词可以应用于模板来修改它们的行为。比如,FMMonth 就是带着 FM 前缀的 Month 模式。表9-22显示了用于日期/时间格式化的修饰词模式。

表9-22. 日期/时间格式化的模板模式修饰词修饰符 描述 例子
FM 前缀 填充模式(抑制填充空白和零) FMMonth
TH 后缀 大写顺序数后缀 DDTH
th 后缀 小写顺序数后缀 DDth
FX 前缀 固定格式全局选项(见用法须知) FX Month DD Day
TM 前缀 翻译模式(基于 lc_messages 显示本地化的日期和月份名) TMMonth
SP 后缀 拼写模式(还未实现) DDSP


日期/时间格式化的用法须知:

FM 抑制前导的零或尾随的空白,如果没有使用它的话,会在输出中增加这些填充最终把输出变成固定宽度的模式。

TM 不包含结尾空白。

如果没有使用 FX ,to_timestamp 和 to_date 在转换字符串的时候忽略多个空白。FX 必须做为模板里的第一个项声明。比如 to_timestamp('2000 JUN', 'YYYY MON') 是正确的,但是 to_timestamp('2000 JUN', 'FXYYYY MON') 会返回一个错误,因为 to_timestamp 只预料会有一个空白。

在 to_char 模板里可以有普通文本,并且它们会被逐字输出。你可以把一个字符串放到双引号里强迫它解释成一个文本,即使它里面包含模式关键字也如此。比如,'"Hello Year "YYYY' 中的 YYYY 将被年份数据代替,但是 Year 里单独的 Y 不会。

如果你想在输出里有双引号,那么你必须在它们前面放双反斜杠,比如 E'\\"YYYY Month\\"' (需要两个反斜杠是因为反斜杠在字符串常量里已经有特殊含义了)。

如果你使用的年份长于4位字符,那么用 YYYY 从字符串向 timestamp 或 date 做转换时要受到限制。你必须在 YYYY 后面使用一些非数字字符或者模板,否则年份总是解释为 4 位数字。比如对于 20000 年:to_date('200001131', 'YYYYMMDD') 将会被解释成一个 4 位数字的年份,最好在年后面使用一个非数字的分隔符,像 to_date('20000-1131', 'YYYY-MMDD') 或 to_date('20000Nov31', 'YYYYMonDD') 。

在从字符串向 timestamp 或 date 转换的时候,如果有 YYY, YYYY 或 Y,YYY 字段,那么 CC 字段会被忽略。如果 CC 与 YY 或 Y 一起使用,那么年份用公式 (CC-1)*100+YY 计算。

将字符串转化为 timestamp 时,毫秒(MS)和微秒(US)都是用字符串的小数点后面的部分转换的。比如 to_timestamp('12:3', 'SS:MS') 不是 3 毫秒, 而是 300 毫秒,因为转换把它看做 12+0.3 秒。这意味着对于格式 SS:MS 而言,输入值 12:3, 12:30, 12:300 声明了相同的毫秒数。对于 3 毫秒,你必须使用 12:003 ,那么转换会把它看做 12+0.003 = 12.003 秒。这个更复杂的例子to_timestamp('15:12:02.020.001230', 'HH:MI:SS.MS.US') 是 15小时、12分钟、2秒+20毫秒+1230微秒 = 2.021230秒。

to_char 的星期编号(参阅'D'格式化模式)与 extract 的不同。

to_char(interval) 将 HH 和 HH12 格式化为一日之内的小时数,而 HH24 可以输出超出一日的小时数,比如 >24 。

表9-23 shows the template patterns available for formatting numeric values

表9-23. 显示了可以用于数值格式化的模版模式。模式 描述
9 带有指定数值位数的值
0 带前导零的值
. (句点) 小数点
, (逗号) 分组(千)分隔符
PR 尖括号内负值
S 带符号的数值(使用区域设置)
L 货币符号(使用区域设置)
D 小数点(使用区域设置)
G 分组分隔符(使用区域设置)
MI 在指明的位置的负号(如果数字 < 0)
PL 在指明的位置的正号(如果数字 > 0)
SG 在指明的位置的正/负号
RN 罗马数字(输入在 1 和 3999 之间)
TH 或 th 序数后缀
V 移动指定位(小数)(参阅注解)
EEEE 科学记数(尚未实现)


数字格式化的用法须知:

使用 SG, PL, MI 生成的符号并不挂在数字上面;比如,to_char(-12, 'S9999') 生成 ' -12' ;to_char(-12, 'MI9999') 生成 '- 12' 。Oracle里的实现不允许在 9 前面使用 MI ,而是要求 9 在 MI 前面。

9 声明和 9 的个数相同的数字位数的数值。如果某个数值位没有数字,则输出一个空白。

TH 不会转换小于零的数值,也不会转换小数。

PL, SG, TH 是 PostgreSQL 扩展。

V 方便地把输入值乘以 10^n ,这里 n 是跟在 V 后面的数字。to_char 不支持把 V 与一个小数点组合在一起使用(也就是说 99.9V99 是不允许的)。

表9-24 显示了一些 to_char 函数的用法。

表9-24. to_char 示例表达式 结果
to_char(current_timestamp, 'Day, DD HH12:MI:SS') 'Tuesday , 06 05:39:18'
to_char(current_timestamp, 'FMDay, FMDD HH12:MI:SS') 'Tuesday, 6 05:39:18'
to_char(-0.1, '99.99') ' -.10'
to_char(-0.1, 'FM9.99') '-.1'
to_char(0.1, '0.9') ' 0.1'
to_char(12, '9990999.9') ' 0012.0'
to_char(12, 'FM9990999.9') '0012.'
to_char(485, '999') ' 485'
to_char(-485, '999') '-485'
to_char(485, '9 9 9') ' 4 8 5'
to_char(1485, '9,999') ' 1,485'
to_char(1485, '9G999') ' 1 485'
to_char(148.5, '999.999') ' 148.500'
to_char(148.5, 'FM999.999') '148.5'
to_char(148.5, 'FM999.990') '148.500'
to_char(148.5, '999D999') ' 148,500'
to_char(3148.5, '9G999D999') ' 3 148,500'
to_char(-485, '999S') '485-'
to_char(-485, '999MI') '485-'
to_char(485, '999MI') '485 '
to_char(485, 'FM999MI') '485'
to_char(485, 'PL999') '+485'
to_char(485, 'SG999') '+485'
to_char(-485, 'SG999') '-485'
to_char(-485, '9SG99') '4-85'
to_char(-485, '999PR') '<485>'
to_char(485, 'L999') 'DM 485
to_char(485, 'RN') ' CDLXXXV'
to_char(485, 'FMRN') 'CDLXXXV'
to_char(5.2, 'FMRN') 'V'
to_char(482, '999th') ' 482nd'
to_char(485, '"Good number:"999') 'Good number: 485'
to_char(485.8, '"Pre:"999" Post:" .999') 'Pre: 485 Post: .800'
to_char(12, '99V999') ' 12000'
to_char(12.4, '99V999') ' 12400'
to_char(12.45, '99V9') ' 125'