先说一问题,如果你输出到终端, 比如 nohup python a.py 2>&1 >/tmp/a.out &
这种启动方式,你去看 /tmp/a.out 啊,看啥 nohup.out 啊.. 另外,想终止进程你就 ps -ef | grep a.py
拿到 pid 之后就 kill 掉呗.
不太了解使用的爬虫框架是啥哈,但是我觉得吧,想解决你这个问题不是很难.起一个 web 服务,起一个消息队列或者别的存储方案都可以,爬虫进程只管关注消息队列或者存储里的任务,有任务就去爬,没有任务就休眠,web 服务只管去操作和监控这个消息队或者存储,以及爬虫的开关即可.
与恶龙缠斗过久,自身亦成为恶龙;凝视深渊过久,深渊将回以凝视…