HTTP代理按匿名度分為透明代理、匿名代理和高度匿名代理。
使用透明爬蟲代理,對方服務器可以知道你使用了代理,并且也知道你的真實IP。
透明爬蟲代理訪問對方服務器所帶的HTTP頭信息如下:
REMOTE_ADDR = 代理服務器IP HTTP_VIA = 代理服務器IP HTTP_X_FORWARDED_FOR = 你的真實IP
(2).匿名爬蟲代理
匿名爬蟲代理隱藏了你的真實IP,但是向訪問對象透露了你是使用代理服務器訪問他們的。
使用高匿名代理,對方服務器不知道你使用了代理,更不知道你的真實IP。
高匿名爬蟲代理訪問對方服務器所帶的HTTP頭信息如下:
REMOTE_ADDR = 代理服務器IP HTTP_VIA 不顯示 HTTP_X_FORWARDED_FOR 不顯示
高匿名爬蟲代理隱藏了你的真實IP,同時訪問對象也不知道你使用了代理,因此隱蔽度最高。