被洛谷封禁的检讨

站务版

@[kkksc03](/space/show?uid=1)
by 扩散性百万甜面包 @ 2018-06-05 00:51:56


前排资瓷!
by Siyuan @ 2018-06-05 00:57:17


@[Himself65](/space/show?uid=72813) 我就是那个前几天问您**洛谷爬虫使用方法**的人,在此对我爬取洛谷内容的行为也一并道歉!目前已经删除脚本,并保证以后不再违规!@[lin_toto](/space/show?uid=256) @[kkksc03](/space/show?uid=1)
by Siyuan @ 2018-06-05 01:03:43


前排资瓷
by つきみやあゆ @ 2018-06-05 06:04:56


@[yyfcpp](/space/show?uid=53062) 表示一下?
by つきみやあゆ @ 2018-06-05 06:05:09


前排资瓷
by Niko @ 2018-06-05 06:40:48


@[Himself65](/space/show?uid=72813) 从某种意义上说,robots.txt 许久没更新了啊,现在都是 recordnew 了
by Anguei @ 2018-06-05 06:48:12


@[lin_toto](/space/show?uid=256) @[kkksc03](/space/show?uid=1) 我写过一个输入 UID,分析 AC 题目难度的爬虫(原理:进入个人空间,获取 AC 列表,顺序访问)。 还有一个输入 UID,分析该用户每个题目提交过多少次的爬虫(原理:进入 recordnew,获取每个提交记录的标题)。 还有一个很久之前写过的爬算法标签的爬虫,那个早就弃用了。 以上爬虫都是单线程。主要在同学圈内使用。 唯一一个带多线程的爬虫是判断 UID 进度的(在接近目标 UID 的时候自动开多线程,其余时间都是 time.sleep(0.8))。 请问这样的爬虫是否合法?会不会造成服务器资源浪费? ----- 个人认为,如果洛谷以后能在个人空间统计出 AC 难度分布,那是最好的。
by Anguei @ 2018-06-05 07:04:14


可以
by 失之_连心 @ 2018-06-05 07:57:20


@[yyfcpp](/space/show?uid=53062) 洛谷一切规则都是人性化的,只要不太过分的爬虫使用一直也都没有管。 只是他那样公然违反 robots.txt 还公开传播的东西,并且在我3次修改页面结构和加入干扰元素之后还继续更新这个爬虫,那就是有点没b数的事情了。
by lin_toto @ 2018-06-05 08:12:17


| 下一页