SQL面试题挑战11:访问会话切割
2023-12-28 21:56:29
问题:
如下为某电商公司用户访问网站的数据,包括用户id和访问时间两个字段。现有如下规则:如果某个用户的连续的访问记录时间间隔小于60秒,则属于同一个会话,现在需要计算每个用户有多少个会话。比如A用户在第1秒,60秒,200秒,230秒有三次访问记录,则该用户有2个会话,其中第一个会话是第1秒和第60秒的记录,第二个会话是第200秒和230秒的记录。
user_id ts
1001 16920000000
1001 16920000050
1002 16920000065
1002 16920000080
1001 16920000150
1002 16920000160
SQL解答:
先按用户分组、时间排序后取每行数据的前一行的时间,然后判断当前行的时间与前一行时间的差值,看是否在给定的范围内,然后再做开窗累加就可以得到每个用户不同的会话编号了。思路如下图:
user_id | ts | 判断与上一行差值是否小于60 | 开窗累加当做会话编号 |
---|---|---|---|
A | 1 | 0 | 0 |
A | 60 | 0 | 0 |
A | 200 | 1 | 1 |
A | 230 | 0 | 1 |
with tmp as (
select 1001 as user_id,16920000000 as ts
union all
select 1001 as user_id,16920000050 as ts
union all
select 1002 as user_id,16920000065 as ts
union all
select 1002 as user_id,16920000080 as ts
union all
select 1001 as user_id,16920000150 as ts
union all
select 1002 as user_id,16920000160 as ts
)
select
user_id
,count(distinct user_group) as user_group_cnt
from
(
select
user_id
,ts
-- 开窗做累加
,sum(flag) over(partition by user_id order by ts) as user_group
from
(
select
user_id
,ts
-- 判断当前行的时间与上一行的差值
,if(ts-last_ts<60,0,1) as flag
from
(
select
user_id
,ts
-- 取当前行的上一个时间,没有上一行就给自身的时间
,lag(ts,1,ts) over(partition by user_id order by ts) as last_ts
from tmp
)t1
)t1
)t1
group by user_id;
文章来源:https://blog.csdn.net/weixin_43597208/article/details/135277043
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!