logo
登录 / 注册

面试被经常问的SQL窗口函数,实战来啦

头像
猴子
2022-04-09 · 猴子数据分析学院创始人

【面试题】


有一张“学生成绩表”,包含4个字段:班级id、学生id、课程id、成绩。


问题1: 求出每个学生成绩最高的三条记录

问题2: 找出每门课程都高于班级课程平均分的学生


【解题步骤】


1. topN问题


问题1是常见的排名问题(topN问题),要想到用 《猴子从零学会SQL》里讲过的窗口函数 来解决这类业务问题。


用窗口函数获取顺序有三种:rank(),dense_rank()和row_number()。


同样是按“值”从小到大排序,三者的区别如下:

根据问题的描述,我们应该使用dense_rank窗户函数

查询结果:


2. 汇总分析


问题2要求找出每门课程都高于班级课程平均分的学生,可以拆解成以下几个问题:


1)求出每个班级,每门课程的平均分


2)将学生每门课程的成绩与所在班级的对应课程平均分相减,结果大于0就说明该学生的这门成绩高于课程平均分


3)“找出每门课程都高于班级课程平均分的学生”说明对于学生来说,最小的“相减结果”都是大于0的


首先用汇总分析求出每个班级,每门课程的平均分。

查询结果:

3. 多表联结


涉及到多表查询,需要用到 多表联结


这里目的是为了将“将学生每门课程的成绩与所在班级的对应课程平均分相减”。


所以,是将原始的“学生成绩表”与“班级的课程平均分”进行联结。


为了保持左表“学生成绩表”的所有数据,将所有学生的成绩都与“课程平均分”x相减,所以选择“左联结(left join)”。






最后使用分组汇总,并结合having条件筛选出“相减结果的最小值大于0”的学生。

【本题考点】


1.考查对分组汇总的了解,以及灵活使用来解决业务问题;


2.考查对多表联结的了解,以及灵活使用来解决业务问题;


3)考查对窗口函数的了解,窗户函数解决的经典问题就那么几种,记下来,就可以解决99%的业务问题,详细见 《猴子从零学会SQL》


推荐:如何从零学会SQL?



平均分 dense 课程
阅读 38
声明:本文内容由脉脉用户自发贡献,部分内容可能整编自互联网,版权归原作者所有,脉脉不拥有其著作权,亦不承担相应法律责任。如果您发现有涉嫌抄袭的内容,请发邮件至maimai@taou.com,一经查实,将立刻删除涉嫌侵权内容。