爬虫代理

为什么需要代理之所以使用代理,可能是因为:1.加速访问速度;2.隐藏主机真实 ip 简单的说,网络通信需要 ip 地址,ip 地址提供主机在网络中的位置,而公共网络 ip 地址具有唯一性。ip 可以理解为主机的门牌号,要保证网络信息的快递顺利送达,必须保证门牌号的唯一性。而就因为是具有唯一性的,所以直接访问对方站点,对方会被明确的告知(写在请求头中)源地址。网络爬虫往往并不能告知对方自己的 ip,因为站点会在一定程度