搜索引擎提示词工程——如何用搜索解决问题?

· · 个人记录

前言

之前居然有人问我关于搜索引擎的问题,我居然配回答这种问题,害怕了。

搜索引擎提示词工程,这个词是我见到“提示词工程“(prompt engineering)以后造的词。

使用搜索引擎可以被视为一种较为原始的为 LLM 输入关键词,只是对应的,你使用的模型没有那么高级,但是范围更加广泛,且过程可探究。

然后可以看看这个:

https://www.luogu.com.cn/blog/Astatine/problem-shooting

以及每个人都应该阅读的:

https://github.com/HandSonic/HTQ

使用关键词并且细化关键词

很多时候一大段描述文字的搜索结果是不尽人意的,这时候就需要清除冗余信息,使用简要的关键词进行搜索。

用空格分隔你的关键词,能够得到包含其中一些关键词的结果,这些结果中很有可能包含你需要的一些信息,可能它和你要进行的第一步是相同的,吸纳有效信息,将它们组合,同时对于没有被包含的关键词,略微修改它们。

不断迭代你的关键词,例如搜索内容过于陈旧就加上年份,搜索到的百度贴吧的教程可能是老教程,这时候可以考虑加上软件版本号等信息。

抽象化搜索内容

避免使用问句,而是使用关于你搜索内容的概念性词汇,或者描述你的目的。

对于有一定头绪/有固定解决方法的问题,搜索时,把你有什么问题改成你解决问题的方式。例如将搜索 ChemDraw 免费使用改为搜索 ChemDraw 激活码/破解版/注册机。

搜索引擎技巧

使用搜索引擎自带的一些功能:

强制包含关键词 双引号括起来某个关键词。

模糊搜索 用星号作为通配符。

搜索引擎自动提示 在输入框内输入内容后先不点击 enter,查看搜索引擎自动补全的问题。

搜索某个网站内的内容 site:网站地址

按文件类型搜索 filetype:要搜索的文件类型

排除关键词 -要排除的关键词

在合适的地方搜索

例如,对于某个领域,你可以先使用搜索引擎搜索这个领域的专业性网站,然后在那里搜索。例如对于搜索 OI 相关内容,可以加入 cnblogs,csdn 等关键词。对于搜索实现某个功能的软件,在 github 搜索。在 github 能搜索到各式各样的内容,包括但不限于电子版书籍。

对于专业性强的内容或者查找论文,可以使用谷歌学术。

合适的搜索还包括使用多种搜索引擎,百度,谷歌,bing,yandex,不同的搜索引擎搜索所得内容很可能不同。

对于特定概念,可以选择维基百科,但是不要使用维基百科自带的搜索功能,而是选择用谷歌搜索,加上 Wikipedia 的关键词。

国内/中文内容使用百度或者 bing 国内版效果更好。

数学相关使用 wolfram alpha(可以直接输入自然语言),整数序列考虑 OEIS。

搜索某个文件时,可以选择在百度文库搜索,得到结果后复制精确的标题再搜索原创力文档等可以免费浏览文件的网站上是否有那份文档。

对于时效性极强,还没有大范围出现的内容,在社交媒体搜索效果更好,包括但不限于微信公众号,

使用插件优化你的搜索

字面意义,用油猴脚本添加几个优化网站界面,排除广告的插件。

回到信源

对于转载,追溯到原创作者处,他可能有更多关于此内容的文章。

对于一个网站,可以去掉其子域名,比如 ti.luogu.com.cn,改为 luogu.com.cn,找到关于这个网站的更多内容。

对于确定的作者,搜索他在不同网站的账号。

网页内查找

有些时候搜索到的内容不是标题含有可用信息而是内容含有,对于过长的内容,使用 Ctrl+F 查找关键信息。

以图搜图

当信息包含图片的时候,使用搜图网站。

谷歌识图,会用识别图片生成关键词的方式搜索,效果一般。

百度识图 image.baidu.com 可以查看图片来源以及相似图片,点击相似图片可以再用相似图片进行以图搜图,这一点比较方便。

Yandex 识图 yandex.com/images 好用,还可以限制只来源于某个特定网站。

trace.moe 截图搜索番剧。

saucenao.com 二次元图片搜索,需要图片高度完整,稍微差一点都搜不到,建议先使用 Yandex 搜到完整图片再用 SauceNAO 搜索来源。

网站没了

使用 whois 查询,并且查询历史解析记录,找到服务器 IP。

在 web.archive.org 搜索该网站的网页快照。

搜有所得

建立书签栏和私人存储空间,之前搜到的不做无用功。

使用 onedrive-vercel-index,将你的 OneDrive 变成可共享使用的网盘。

按照日期与类型分类,仔细整理文件,大文件云上储存,关键文件一定保留离线备份。

其他内容

不妨问问 Chat GPT ?虽然大概率没有啥精细的结果,但是可以考虑让它给你推荐几个网站。

搜索电子书:https://tool.yibook.org/

stackoverflow,解决软件/代码方面的问题。

stackexchange 以及其子板块,内容极其丰富,海纳百川。

zh.wikihow.com 各类简明指南。

乱码恢复

清华大学开源软件镜像站

能不能好好说话-搜索简写含义

你知道我要说什么

救命,我不行了!

如果实在搜不到,问别人吧,态度良好地承认自己做不到,不丢人。

在论坛上提问,等待别人的解答。

但是一定要具体地描述问题,谨记 RTFM,STFW,参考提问的智慧。

例子

例一

在某场考试后,我看到题解里写道:

先xxx,再xxx,发现是xxx,使用 BM 即可。

于是我搜索 BM,这次搜索的问题是关键词不合适,结果乱七八糟。

加关键词,BM 算法。

得到 Boyer-Moore,然而那道题是计数,显然对不上。

这里可以发现 BM 算法是个多义关键词,所以要用其他关键词限制它。

搜索 BM 算法 数列。

得到结果,Berlekamp-Massey 算法,使用精准的关键词替代模糊的 “BM 算法”。

该看洛谷日报了

例二

我了解到有个概念叫“毛营”。

直接搜索,结果令人?????

加关键词,毛营 OI,仍然不好。

再加!毛营 cnblogs。

似乎是某个训练营,和 ICPC/ACM 有关。

加关键词 毛营 ICPC cnblogs。发现关键词 ICPC 过于霸道了,去掉。

随便翻两页结果,在某人博客里发现毛营全称Petrozavodsk Camp。