Python抓站如何使用代理服务器

Python抓站在我们解决某些搜索引擎中的问题时有很广泛的应用。但是有些代码我们还是不能熟练的掌握。下面我们就详细的看看如何进行相关的问题解决。希望大家对Python抓站有所收获。

import urllib2

 
 
 
  1. content = urllib2.urlopen('http://XXXX').read() 

使用代理服务器

这在某些情况下比较有用,比如IP被封了,或者比如IP访问的次数受到限制等等。

 
 
 
  1. import urllib2  
  2. proxy_support = urllib2.ProxyHandler({'http':'http://XX.XX.
    XX.XX:XXXX'})  
  3. opener = urllib2.build_opener(proxy_support, urllib2.
    HTTPHandler)  
  4. urllib2.install_opener(opener)  
  5. content = urllib2.urlopen('http://XXXX').read() 

以上就是对Python抓站有关问题的详细介绍。

【编辑推荐】

  1. Python函数式和Ruby的相关技术比较
  2. Python生成随机数与随机字符串的基本应用
  3. 简介Python代码两大实际应用手册
  4. 讲述Python编程语言的可操作性
  5. Python逻辑操作中的三大应用方案
THE END