某些业务表出于历史原因或性能原因,都使用了违反第一范式的设计模式。即同一个列中存储了多个属性值。如下表中的 bill_ids 所示:
|
gmt_create
|
bill_ids
|
|
2019-08-12 00:00:00
|
209755,209756,209757
|
|
……
|
……
|
这种情况下,可以考虑
将该列根据分隔符进行分割,形成多个列
。如下表所示:
|
gmt_create
|
bill_id1
|
bill_id2
|
bill_id3
|
|
2019-08-12 00:00:00
|
209755
|
209756
|
209757
|
|
……
|
……
|
……
|
……
|
可以使用MySQL中的
字符串拆分函数
实现,函数说明如下:
SUBSTRING_INDEX(str,delim,count)
举个栗子:
对于字符串 “209755,209756,209757” ,设置delim为 “,”,count为1,就会返回 “209755”;其它参数不变,count为2,就会返回 “209755,209756”;其它参数不变,count为-1,就会返回 “209757”。
最后,具体实现如下:
select gmt_create
,(select substring_index(substring_index(bill_ids,',',1),',',-1)) bill_id1
,(select substring_index(substring_index(bill_ids,',',2),',',-1)) bill_id2
,(select substring_index(substring_index(bill_ids,',',3),',',-1)) bill_id3
from lt_repayment;
注意:
1.这里默认 bill_ids 这个字段都是三个值组成的集合,若不知道要分割的字段究竟有几个值(如可能某些行就1个值,某些有6个),可以考虑根据具有最多值的数量来选择使用多少条(select substring_index(substring_index(bill_ids,’,’,第几个值),’,’,-1))语句。但是会有个问题:
上表分割后的结果是
更合理的结果应该是
| id1 | id2 | id3 | id4 |
|---|
| 2 | null | null | null |
| 1 | 2 | 3 | 4 |
| 1 | 3 | null | null |
;
2.分割后取数的性能较差;
3.数据表设计时还是需要遵从第一范式,即任何属性都是原子性的,不可再分。
某些业务表出于历史原因或性能原因,都使用了违反第一范式的设计模式。即同一个列中存储了多个属性值。如下表中的 bill_ids 所示:gmt_createbill_ids2019-08-12 00:00:00209755,209756,209757…………这种情况下,可以考虑将该列根据分隔符进行分割,形成多个列。如下表所示:gmt_createbil...
select distinct(substring_index(substring_index(a.col,',',b.help_topic_id+1),',',-1))
(select group_concat(
select
max(case when F1%3=1 then F1 else 0 end) a,
max(case when F1%3=2 then F1 else 0 end) b,
max(case when F1%3=0 then F1 else 0 end) c
from HLR151
group by (F1-1)/3
select
c1=a.F1,c2=b.F1,c3=c.F1
from HLR151 a
left join HLR151 b on b.F1=a.
自己记录一下:
会议表(rsgl_hygl_hyxx)里面有
一个参会人员字段(ch_ry_mc),存放的是人员表id(数据形式如:123,234,567,789),我需要将某个会议的参会人员字段按
逗号拆分开多条数据。
举个例子:
某条会议数据的相关字段如下:
我要实现的结果如下:
您可以使用以下 SQL 语句来实现:
SELECT SUBSTRING_INDEX(SUBSTRING_INDEX(your_column, ',', n), ',', -1)
FROM your_table
WHERE n > 0
其中,your_column 是您想要分解的字段,your_table 是您的表的名称,n 是您想要分解的第几个逗号之后的字段。这个查询会返回所有逗号之后的字...