python爬虫通用框架

import requests

公司主营业务:网站制作、网站建设、移动网站开发等业务。帮助企业客户真正实现互联网宣传,提高企业的竞争能力。创新互联是一支青春激扬、勤奋敬业、活力青春激扬、勤奋敬业、活力澎湃、和谐高效的团队。公司秉承以“开放、自由、严谨、自律”为核心的企业文化,感谢他们对我们的高要求,感谢他们从不同领域给我们带来的挑战,让我们激情的团队有机会用头脑与智慧不断的给客户带来惊喜。创新互联推出商南免费做网站回馈大家。

def getHTMLText(url):

try:

r = requests.get(url,timeout=30)

r.raise_for_status()  # 如果状态不是200,引发HTTP-Error异常

#print(r.status_code)

r.encoding = r.apparent_encoding

return r.text

except:

return "产生异常"

if __name__=="__main__":

url = "https://item.jd.com/5107323.html"

print(getHTMLText(url))


网站题目:python爬虫通用框架
转载源于:http://azwzsj.com/article/pesphp.html