这是最近项目关于SQL语句的,本文简单记录并总结以下几个知识点:
1.如何统计一张表中某个字段的总数,如不同"专业"的学生数及所占百分比;
2.如何联系另一张表进行查询某个字段的总数及百分比;
3.简单介绍decode防止分母为0和trunc保留小数位数等函数;
4.通常复杂的SQL语句会涉及到查询结果横向连接和纵向连接,这里进行介绍。
最近买了本《Oracle查询优化改写技巧与案例·有教无类 落落》,推荐大家也阅读下。后面我也会补充一些相关数据的知识,希望对大家有所帮助吧!文章还是以基础知识为主,同时主要是解决实际的问题。同时我采用自问自答的新叙述方法进行介绍~
0. 前言
假如现在存在如下图所示的一张表,这种表在数据库中是很常见,主要包括字段(序号,教师姓名,单位名称,性别,学历)。该表的信息为:TEST_TEACHER(id,name,dw_name,sex,degree)。
1.问题一: 如何在单表中统计总数及比例
现在需要统计各个单位的教师人数,及该单位的不同学历的、性别的人数。这是非常常见的问题,当时项目中统计的内容很多,包括:年龄、学缘、职称、专业等等。
这很简单并且方法很多,常见的主要使用子查询或group by分组。
group by:
输出结果如下图所示:其中order by是按汉语拼音排序输出。
CASE WHEN THEN:
输出结果如下图所示:表示如何SEX为"男",统计加1。
传统方法该步骤是分别统计两个数,再通过后台Java或C++进行处理的,或者是使用除法: 学院总数/老师表总数,但是已经使用了分组group by,如果再使用一遍统计TEST_TEACHER总数就会报错。
这里使用的是Oracle的函数ratio_to_report() over()实现。
ratio_to_report:
输出结果如下图所示:其中计算机3个老师,总数10个老师,比例占0.3。
2.问题二: 联系另一张表统计总数及比例
在设计数据库过程中,通常会将教师的信息设置为一张表,学院信息会存在另一张表中,同理授课信息、发表论文信息都会存在单独的表,再通过教师姓名(或教师编号)连接查询。
所以这里讲述第二种统计总数及比例的方法,假设还存在一张学院表,如下图所示:该表TEST_DEP结构为(DW_NAME,DW_CODE,YEAR,ADDR)。
输出结果如下图所示:这种方法是非常常见的一种统计方法,而不是仅仅通过单表,因为数据库往往都会通过外键联系其他表。
两表连接子查询:统计比例
输出结果如下图所示:
3.问题三: 除法防止分母为0及保留有效位数
如上图输出为0.6666667,此时需要保留有效位数,这里的方法可以是使用trunc()函数,整数可用floor()函数。
TRUNC(x[,y])功能: 计算截尾到y位小数的x值,y缺省为0,结果变为一个整数值。
trunc()是截断操作,floor(x)是小于或等于x的最大整数。
TRUNC() FLOOR():
输出结果如下图所示:
其中输出为66.66,表示计算机学院男教师所占百分比,其中保留2位有效数字的方法为:trunc( 统计男教师子查询 / 统计教师子查询*100,2)。
Oracle中通常需要统计如男生占全班总人数比例等用法,此时如果分母为0,它会报错"[Err] ORA-01476: divisor is equal to zero"。那怎么办呢?
解决方法:使用函数decode,当分母为0时直接返回0,否则进行除法运算。
select a/b from c; 修改成如下即可:select decode(b, 0, 0, a/b) from c;
例如:decode(XF_ALL, 0, 0,trunc(XF_MATH / XF_ALL * 100, 1)) as BL
上面子查询除法使用decode的并结合trunc保留2位有效数字的SQL如下。
decode():
输出结果如下图所示,核心方法:trunc(decode(b,0,0,a/b)*100, 2)。
4.问题四: 查询横向连接和纵向连接
复杂的SQL语句通常包括横向连接和纵向连接。
横向连接:使用自定义子查询
这里使用的方法是子查询自定义命名的方法,该方法只返回一行数据,通常通过Json格式给后台,后台只需要显示即可。它的优势是不论表多复杂或表之间没有关系,而是只需要把值统计在一行,都能联系返回结果。
如下图所示,这就是横向连接返回的结果,但是需要知道具体的学院名称。
纵向连接:使用UNION ALL连接
假设现在只需要统计"软件学院"、"计算机学院"的信息,这里需要纵向连接,则使用UNION ALL自然连接。
Union:对两个结果集进行并集操作,不包括重复行,同时进行默认规则的排序;
Union All:对两个结果集进行并集操作,包括重复行,不进行排序。
注意:COUNT需要使用GROUP BY,这种方法的优势是如果表中存在很多NULL的单位信息或只需要统计几个固定的学院信息,此时使用该方法就比较适合。
总之,特定的场合需要特定的处理方法。
输出结果如下图所示:
最后希望文章对你有所帮助,这是一篇我的在线笔记,同时后面结合自己实际项目和SQL性能优化,将分享一些更为专业的文章~还有20多天就要毕业当老师了,哈哈!
希望能与大家一起在华为云社区共同承载,原文地址:https://blog.csdn.net/Eastmount/article/details/51660174
(By:娜璋之家 Eastmount 2021-07-25 夜于武汉)