基础算法(7):离散化和区间合并
2024-01-01 20:34:15
1.离散化
? ? ?离散化是一个很好用的技巧,可以很大程度上降低时间和空间复杂度
? ? ?离散化是把无限空间中有限的个体映射到有限的空间中去,减少空间的使用。
? ? ?比如:我们有一组很大的数据 :1? 3? 277438? 2884821? ?428? ?239823128
? ? ?如果我们想要把这些数作为数组的下标来存储的话,我们就要开辟一个很大空间的数组,但很显然,其中很多空间我们是用不到的,浪费的不是一星半点,我接受不了,题目也不会让你过。
? ? ?总的来说,离散化的特点是这样的:
1.数据值域很大,但数据个数比较少,一般来说值域<=10^5,可以用前缀和,大于这个点就要考虑离散化
2.把值域里的数映射到连续的自然数的序列中,这个映射就是把数组的值映射到对应的下标
? ? ?但也存在着一些问题,比如:
1.数组存储值域的数可能有重复的元素,需要去重
2.怎么快速去映射,我们可以通过二分来快速算出x离散化后的值,即x对应的下标
? 模板? ?
? ? ?让我们看看是如何实现的,下面给出模板:
vector<int> alls; // 存储所有待离散化的值
sort(alls.begin(), alls.end()); // 将所有值排序
alls.erase(unique(alls.begin(), alls.end()), alls.end()); // 去掉重复元素
// 二分求出x对应的离散化的值
int find(int x) // 找到第一个大于等于x的位置
{
int l = 0, r = alls.size() - 1;
while (l +1!= r)
{
int mid = l + r >> 1;
if (alls[mid] >= x) r = mid;
else l = mid ;
}
return r + 1; // 映射到1, 2, ...n
}
应用
? ??
#include <iostream>
#include <vector>
#include <algorithm>
using namespace std;
const int N = 300010;
int n, m;
int a[N];//存储坐标插入的值
int s[N];//存储数组a的前缀和
vector<int> alls; //存储(所有与插入和查询有关的)坐标
vector<pair<int, int>> add, query; //存储插入和询问操作的数据
int find(int x) { //返回的是输入的坐标的离散化下标
int l = 0, r = alls.size() - 1;
while (l+1!=r) {
int mid = l + r >> 1;
if (alls[mid] >= x) r = mid;
else l = mid ;
}
return r + 1;
}
int main() {
scanf("%d%d", &n, &m);
for (int i = 1; i <= n; i++) {
int x, c;
scanf("%d%d", &x, &c);
add.push_back({x, c});
alls.push_back(x);
}
for (int i = 1; i <= m; i++) {
int l , r;
scanf("%d%d", &l, &r);
query.push_back({l, r});
alls.push_back(l);
alls.push_back(r);
}
//排序,去重
sort(alls.begin(), alls.end());
alls.erase(unique(alls.begin(), alls.end()), alls.end());
//执行前n次插入操作
for (auto item : add) {
int x = find(item.first);
a[x] += item.second;
}
//前缀和
for (int i = 1; i <= alls.size(); i++) s[i] = s[i-1] + a[i];
//处理后m次询问操作
for (auto item : query) {
int l = find(item.first);
int r = find(item.second);
printf("%d\n", s[r] - s[l-1]);
}
return 0;
}
? ? ?这道题数据的值域已经达到了10^9,远远比10^5大,所以前缀和是用不了的,我们要使用离散化。我们首先将所有操作相关的数据分别存入到add和query容器中,把与操作有关的坐标存入alls容器中;接下来就是要对alls容器的数据进行排序去重的操作,这里用到了unique函数,这个函数把一个序列的重复数据从小到大放在序列末尾,并返回重复数据的第一个数据的迭代器。接下来就可以把每个坐标映射为一个自然数序列,并把它们存储的值插入到a数组中了,我们先对输入坐标进行离散化,即find函数执行的操作,这样再插入,每个值对应的下标就是一个自然数序列了,之后我们再对a数组求前缀和,执行询问操作就很简单了,这里借用两张图:
2.区间合并
?? ? 区间合并也是一种算法,主要用来合并区间,没错,就是这么简单粗暴,下面先给出模板,结合例题来领悟这种算法。
模板:
vector<PII> merge(vector<PII>& segs)
{
vector<PII>res;
sort(segs.begin(),segs.end());//按左端点进行排序
int st=-2e9,ed=-2e9;//st表示区间左端点,ed表示区间右端点
for(auto seg:segs)
if(ed<seg.first)//情况1:两个区间无法合并,该区间的右端点比另一个区间的左端点还要小
{
if(st!=-2e9)res.push_back({st,ed});//区间1放进res数组
st=seg.first,ed=seg.second;//维护区间2
}
else ed=max(ed,seg.second);//两个区间可以合并,且区间1不包含区间2,区间2不包含区间1
//如果是区间1包含区间2,这时候不需要任何操作
if(st!=-2e9)res.push_back({st,ed});//循环结束之后,st,ed变量不需要继续维护,因为这是最后一个序列,不能继续进行合并,直接放进res数组中即可
return res;
? ? ? ?这就是区间合并的模板,下面看例题:
应用:
#include<iostream>
#include<algorithm>
#include<vector>
using namespace std;
typedef pair<int,int>PII;
const int N=100010;
int n;
vector<PII>segs;
vector<PII> merge(vector<PII>& segs)
{
vector<PII>res;
sort(segs.begin(),segs.end());//按左端点进行排序
int st=-2e9,ed=-2e9;//st表示区间左端点,ed表示区间右端点
for(auto seg:segs)
if(ed<seg.first)//情况1:两个区间无法合并,该区间的右端点比另一个区间的左端点还要小
{
if(st!=-2e9)res.push_back({st,ed});//区间1放进res数组
st=seg.first,ed=seg.second;//维护区间2
}
else ed=max(ed,seg.second);//两个区间可以合并,且区间1不包含区间2,区间2不包含区间1
//如果是区间1包含区间2,这时候不需要任何操作
if(st!=-2e9)res.push_back({st,ed});//循环结束之后,st,ed变量不需要继续维护,因为这是最后一个序列,不能继续进行合并,直接放进res数组中即可
return res;
}
int main()
{
cin>>n;
for(int i=0;i<n;i++)
{
int l,r;
cin>>l>>r;
segs.push_back({l,r});
}
vector<PII>res=merge(segs);
cout<<res.size()<<endl;
return 0;
}
文章来源:https://blog.csdn.net/pancodearea/article/details/135327199
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!