背景介绍
越来越多的程序员关注数据结构和算法的知识,会在leetcode和牛客等各种网站刷题,但是遇到一些中等难度或者困难难度的题就束手无策,而我通过刷题来写一些关于中等或者困难的题目的题解,达到一个自己越来越熟悉,而且还可以帮助别人理解的程度。接下来我会用两种策略来解决这道题——数据流中的中位数。
数据流中的中位数解法
Problem
如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流,使用GetMedian()方法获取当前读取数据的中位数。
Solution(两种解决策略)
解决策略1
- 建立一个大根堆和一个小根堆,用一个临时变量(count)来统计数据流的个数
- 当插入的数字个数为奇数时,使小根堆的个数比大根堆多1;当插入的数字个数为偶数时,使大根堆和小根堆的个数一样多
- 当总的个数为奇数时,中位数就是小根堆的堆顶;当总的个数为偶数时,中位数就是两个堆顶的值相加除以2
Code1
1 | import java.util.Comparator; |
Test1
解决策略2
- 建立一个大根堆和一个小根堆,必须确保满足两点:
- 小根堆里面的数 > 大根堆里面的数
- 大根堆和小根堆的个数差值必须 <= 1
- 当总的个数为偶数时:
- 中位数就是(大根堆堆顶+小根堆堆顶)/ 2.0
- 当总的个数为奇数时:
- 大根堆的个数 > 小根堆的个数,则中位数就是大根堆的堆顶
- 大根堆的个数 < 小根堆的个数,则中位数就是小根堆的堆顶
Code2
1 | import java.util.Comparator; |
Test2
总结
今天介绍的是LeetCode上的困难题目——数据流中的中位数。其实可以用排序的方式进行计算,但是计算的话会耗费O(N*logN)的时间复杂度,代价太高。因为我们只关注数据流的中位数,为何要去排序呢。最后通过大根堆和小根堆进行操作就可以计算出中位数,时间代价也就O(logN),空间复杂度为O(N)。