python urllib爬取百度云连接的实例代码的方法

来源：网络时间：2018-02-22 13:01:45

Stream Vera Sans Mono', 'Courier New', Courier, monospace !important; FLOAT: none !important; BORDER-TOP-WIDTH: 0px !important; BORDER-BOTTOM-WIDTH: 0px !important; HEIGHT: auto !important; COLOR: rgb(0,102,153) !important; CLEAR: both; VERTICAL-ALIGN: baseline !important; OVERFLOW: visible !important; TOP: auto !important; RIGHT: auto !important; FONT-WEIGHT: bold !important; PADDING-TOP: 0px; LEFT: auto !important; border-radius: 0px; border-image-source: initial; border-image-slice: initial; border-image-width: initial; border-image-outset: initial; border-image-repeat: initial; background-size: initial; background-origin: initial; background-clip: initial" class="py keyword">from bs4 
import BeautifulSoup

import urllib

import requests

import re

adr 
=[]

''''对搜素资源名字进行url编码'''

Search_text 
=raw_input('请输入搜索资源名：')

search_text 
= search_text.decode('gbk')

search_text 
= search_text.encode('utf-8')

search_text 
= urllib.quote(search_text)

''''获取文件地址'''

home 
= urllib.urlopen('/s/name/'+search_text)

'''获取百度云地址'''

def getbaidu(adr):

  for i in adr:

    url 
= urllib.urlopen(''+i)

    bs 
= BeautifulSoup(url)

    bs1 
= bs.select('.dbutton2')

    href 
= re.compile('http\%(\%|d|w|//|/|.)*')

    b = href.search(str(bs1))

    name 
= str(bs.select('.center')).decode('utf-8')

    text1 
= re.compile('<h1sclass="center">[d|w|D|W]*</h1>')

    text2 
= text1.search(name)

    rag1 
= re.compile('>[d|w|D|W]*<')

    if text2:

      text3 
= rag1.search(text2.group())

      if text3:

        print text3.group()

    if b:

      text 
= urllib.unquote(str(b.group())).decode('utf-8')

      print text

'''初始化'''

def init(adr):

  soup 
= BeautifulSoup(home)

  soup 
= soup.select('.row')

  pattern 
= re.compile('/r/d+')

  for i in soup:

    i = str(i)

    adress 
= pattern.search(i)

    adress 
= adress.group()

    adr.append(adress)

print 'running---------'   

init(adr)

getbaidu(adr)

<上一篇： Python获取IP地址的三种方法下一篇：Python的Tornado框架实现数据可视 >

文章内容来源于网络，不代表本站立场，若侵犯到您的权益，可联系我们删除。（本站为非盈利性质网站）联系邮箱：[email protected]

python urllib爬取百度云连接的实例代码的方法

python爬取138看书网小说源码

爬的更高

biqumo小说爬取程序

biqumo小说爬取程序

贝壳图片爬取工具

Pixiv图片爬取工具

小红书图片爬取

建邺云课堂视频爬取工具

打倒魔王的方法

C语言代码实例助手

易取键代码

小红书图片爬取工具