A*算法浅谈

Thomasguo666 · 2019-03-06 21:06:13 · 算法·理论

前置芝士：堆优化Dijkstra/优先队列bfs（其实本质上相同）

简介

A*算法是一种常见的搜索算法，可以用于在搜索中更快找到并判定最优解。

概念

最短路问题，大家应该都会解吧。堆优化dij其实就是优先队列bfs。

但是，优先队列bfs的策略有一个缺点：当前代价最小的状态，接下来可能有很大的代价。这就导致了最优解可能反而出现的比较晚。

于是我们很自然地想到一个对策：定义一个估价函数f(x)，表示状态x到最终状态的代价的估计值，而每次从堆中取出并扩展的是“当前代价+估值”最小的状态。并且，每个状态第一次出队，就是初始状态到它的最优解。

而这个估价函数f(x)有一个很重要的性质：假设g(x)为状态x到最终状态的实际值，则：

f(x)\leq g(x)

为什么呢？我们举个例子看看：（w是边权）

显然，最短路应该是走最左边这条，代价为9+5+3=17，但是由于这条边上的估值都被过大的估计导致结果算错（算出来是9+8+6=23）

而如果保证f(x)\leq g(x)，则即使某非最优解搜索路径上的状态s，由于估值不够准确，先被扩展了，但是：

由于s并非最优，故随着当前代价不断累加，总有一时刻s的当前代价大于从初始状态到目标状态的最小代价。
在最优解搜索路径上的状态t，由于f(t)\leq g(t)，故t的当前代价加上f(t)小于等于从初始状态到目标状态的最小代价。

综上所述，t将会被取出并扩展，并得到最优解。（在本文中请区分“扩展”与“被扩展”）

而且我们可以想到，f(x)越接近g(x)，就能越快找到最优解。

这种带估值函数的优先队列bfs，就是A*。

接下来我们通过几个例子，讲一讲A*估值函数的设计。

估值函数

先看一道例题：

集合位置

题意：求1号点到n号点的次短路长度。

我们已经说过，每个状态第一次出队，就是初始状态到它的最小代价。事实上，每个状态第k次出队，就是初始状态到它的第k小代价。(由数学归纳法)

并且每个状态的第k小代价，必是由某一个出队k-1次的状态扩展得到的。

证明：

由于每个状态第k次出队，就是初始状态到它的第k小代价(k\in N^+)，故对于一个已出队k次的状态i，由于另一个最小的被出队k次并能扩展到i的状态j扩展到i的当前代价，必然比任意一出队k+1次的状态l扩展到i的当前代价低（该代价必然比出队k次的l扩展到i的当前代价大），又比任意一出队k-1次的状态扩展到i的代价要大，故当前代价就是初始状态到i的第k+1小代价，是由出队k次的j扩展得到的。

综上所述，就是初始状态到每个状态的第k小代价，是由一个出队k-1次的状态扩展得到的。

故控制每个节点出队不超过2次，n号节点第2次出队时的代价就是次短路。

一个注意点：每个节点最多扩展一次，入队一次，出队两次。

那么现在我们需要设计一个估值函数。

然后发现，直接令f(x)为x到n的最短路即可。

#include <bits/stdc++.h>
using namespace std;
typedef double db;
db x[205],y[205],f[205];
int vis[205];
struct dat
{
    int u;
    db w;
    bool operator < (const dat &rhs) const {
        return w>rhs.w;
    }
};
struct ndat //注意：不仅要存储每个节点的当前代价+f(x)，还要存储该搜索路径上的每个节点的访问情况。每个节点最多访问一次！
{
    int u;
    db w;
    int vis[205];
    ndat (int u,db w):u(u),w(w) {
        memset(vis,0,sizeof(vis));
    }
    bool operator < (const ndat &rhs) const {
        return w>rhs.w;
    }
};
inline double a(int i,int j)
{
    return sqrt(pow(x[i]-x[j],2)+pow(y[i]-y[j],2));
}
vector<int> G[205];
void addedge(int i,int j)
{
    G[i].push_back(j);
    G[j].push_back(i);
}
int main()
{
    int n,m,tot=0;
    db ans=-1;
    cin>>n>>m;
    for (int i=1;i<=n;i++) cin>>x[i]>>y[i];
    for (int i=1;i<=m;i++)
    {
        int u,v;
        cin>>u>>v;
        addedge(u,v);
    }
    memset(f,127,sizeof(f));
    f[n]=0;
    priority_queue<dat> Q;
    priority_queue<ndat> q;
    Q.push((dat){n,0});
    while (!Q.empty()) //先预处理处每个节点的f(x)
    {
        dat p=Q.top();Q.pop();
        int u=p.u;
        if (vis[u]) continue;
        vis[u]=1;
        for (int i=0;i<G[u].size();i++)
        {
            int v=G[u][i];
            if (f[u]+a(u,v)<f[v])
            {
                Q.push((dat){v,f[u]+a(u,v)});
                f[v]=f[u]+a(u,v);
            }
        }
    }
    q.push((ndat){1,f[1]});
    while (!q.empty())
    {
        ndat p=q.top();q.pop();
        int u=p.u;
        db w=p.w-f[u];
        if (u==n) ++tot;
        if (tot==2)
        {
            ans=w;
            break;
        }
        for (int i=0;i<G[u].size();i++)
        {
            int v=G[u][i];
            if (p.vis[v]) continue; //如果当前搜索路径上访问过该点，则不必再次访问
            ndat nv=p;
            nv.u=v;
            nv.w=w+a(u,v)+f[v];
            nv.vis[v]=1;
            q.push(nv);
        }
    }
    (ans<0)?printf("%d\n",-1):printf("%.2f",ans);
    return 0;
}

利用这个思路，我们还可以解决k短路问题

对于题目中的“总能量”条件，其实和总数量（即k）是一样的。转化一下即可。

事实上，对于标准的k短路（即限制总数量的k短路），它的复杂度上界和普通的dij一样，都是O(knlogn)（这里认为点数n和边数m同阶），但是一般情况下复杂度远远达不到这个上界，所以这个算法（作为一种骗分方式来说）还是相当优秀的（当然啦，因为一开始还有跑一遍标准的最短路，所以准确的说是O((k+1)nlogn)，不过这不就一点常数的问题嘛。。。）。

(顺便说一句，这题~~不知道怎么回事恶意~~卡A*，非要用左偏树可并堆来做。在我看来这是一种无聊而可恶的行径，没有什么教育意义。~~前面的都是屁话，最重要的是，不让我们多A一道题~~)

这道题并不需要控制每个状态访问的次数。

// luogu-judger-enable-o2
#include <bits/stdc++.h>
using namespace std;
typedef double db;
db dis[5005],f[5005];
int t[5005],vis[5005];
struct dat
{
    int u;
    db w;
    bool operator < (const dat &rhs) const {
        return w>rhs.w;
    }
};
vector<dat> G[5005],g[5005];
void addedge(int i,int j,db w)
{
    G[i].push_back((dat){j,w});
    g[j].push_back((dat){i,w});
}
int main()
{
    int n,m,ans=0;
    db e;
    cin>>n>>m>>e;
    if (e>1000000)
    {
        cout<<"2002000"<<endl;
        return 0;
    }
    for (int i=1;i<=m;i++)
    {
        int u,v;
        db w;
        cin>>u>>v>>w;
        addedge(u,v,w);
    }
    memset(f,127,sizeof(f));
    f[n]=0;
    priority_queue<dat> q,Q;
    Q.push((dat){n,0});
    while (!Q.empty())
    {
        dat p=Q.top();Q.pop();
        int u=p.u;
        if (vis[u]) continue;
        vis[u]=1;
        for (int i=0;i<g[u].size();i++)
        {
            dat v=g[u][i];
            if (f[u]+v.w<f[v.u])
            {
                Q.push((dat){v.u,f[u]+v.w});
                f[v.u]=f[u]+v.w;
            }
        }
    }
    q.push((dat){1,f[1]});
    while (!q.empty())
    {
        dat p=q.top();q.pop();
        int u=p.u;
        db w=p.w-f[u];
        if (u==n)
        {
            e-=w;
            if (e>=1e-6) ans++;
            else break;
            continue;
        }
        for (int i=0;i<G[u].size();i++)
        {
            dat v=G[u][i];
            q.push((dat){v.u,w+v.w+f[v.u]});
        }
    }
    cout<<ans<<endl;
    return 0;
}

A*的另一个应用就是8数码问题

我们发现，无论是多么好的策略，从一个状态到目标状态的代价，都不会低于该状态中每个数不为0的数x到目标状态中的x的曼哈顿距离之和。故我们可以把估价函数设为这个和。即：

f(state)=\sum_{i=1}^8(|state.col_i-end.col_i|+|state.row_i-end.row_i|)

并且，不同于k短路问题，每个状态最多扩展一次。即一个状态第二次被取出，就可以直接把它扔掉了。（这其实是正常A*的套路。）

如何判定一个状态是否扩展过呢？这里直接使用std::map进行判定。不过，有一种叫康托展开的方法可以把1~9的全排列映射成1~362880的正整数（0~8当然也行），请自行~~翻题解~~百度。

代码：

#include <bits/stdc++.h>
#define in inline
using namespace std;
// lyd /-\|<|O|
const int end=123804765;
map<int,int> vis;
int d[4]={-3,-1,1,3}; //四个方向
int pow10[]={
    1,10,100,1000,10000,100000,1000000,10000000,100000000
};
in int get(int x,int p) //获取x的右数第p位
{
    return int(x/pow10[p-1])%10;
}
in int isup(int x) //判断是否在边缘
{
    return x<=3;
}
in int isdown(int x)
{
    return x>=7;
}
in int isleft(int x)
{
    return x%3==1;
}
in int isright(int x)
{
    return x%3==0;
}
in int swap(int x,int a,int b)
{
    int s=get(x,a),t=get(x,b);
    x-=s*pow10[a-1]+t*pow10[b-1];
    x+=s*pow10[b-1]+t*pow10[a-1];
    return x;
}
in int row(int x)
{
    return (x-1)/3;
}
in int col(int x)
{
    return (x-1)%3;
}
in int f(int state) //估值函数
{
    int s[20],t[20];
    memset(s,0,sizeof(s)),memset(t,0,sizeof(t));
    int ans=0;
    for (int i=1;i<=9;i++) s[get(state,i)]=i,t[get(end,i)]=i;
    for (int i=1;i<=8;i++) ans+=abs(row(s[i])-row(t[i]))+abs(col(s[i])-col(t[i])); 
    return ans;
}
struct data
{
    int s,w;
    data () {}
    data (int s,int w):s(s),w(w+f(s)) {}
    bool operator < (const data &rhs) const
    {
        return w>rhs.w;
    }
};
priority_queue<data> q;
int main()
{
    int s;
    cin>>s;
    q.push(data(s,0));
    vis.clear();
    while (!q.empty())
    {
        int p;
        data u=q.top();q.pop();
        if (vis[u.s]) continue;
        if (u.s==end) 
        {
            cout<<u.w<<endl;
            return 0;
        }
        vis[u.s]=1;
        for (int i=1;i<=9;i++)
        {
            int x=get(u.s,i);
            if (!x) 
            {
               p=i;
               break;
            }
        }
        for (int i=0;i<4;i++)
        {
            if (i==0 && isup(p)) continue; //判断位置是否合法
            if (i==1 && isleft(p)) continue;
            if (i==2 && isright(p)) continue;
            if (i==3 && isdown(p)) continue;
            int pp=p+d[i];
            int t=swap(u.s,p,pp);
            q.push(data(t,u.w-f(u.s)+1));
        }
    }
}

结语

A*算法是启发式搜索的一种。事实上除了A*算法外还有IDA*（迭代加深启发式搜索）。在考场上，如果有扎实的搜索功底，是可以拿到很多分的。（毕竟，像最短路算法，dp等，都和搜索有关系。）