我们专注攀枝花网站设计攀枝花网站制作攀枝花网站建设

成都网站建设公司服务热线：400-028-6601

网站建设知识

十年网站开发经验 + 多家企业客户 + 靠谱的建站团队

量身定制 + 运营维护+专业推广+无忧售后，网站问题一站解决

python简单爬虫笔记

python模拟游览器爬取相关页面

创新互联公司2013年成立，是专业互联网技术服务公司，拥有项目网站建设、网站制作网站策划，项目实施与项目整合能力。我们以让每一个梦想脱颖而出为使命，1280元西宁做网站,已为上家服务,为西宁各地企业和个人服务,联系电话:18982081108

import urllib.request

url="https://blog.51cto.com/itstyle/2146899"

#模拟浏览器
headers=("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36")
opener=urllib.request.build_opener()
opener.addheaders=[headers]
data=opener.open(url).read()

fh=open("D:/5.html","wb")
fh.write(data)
fh.close()

python爬取新闻网站并将文章下载到本地

import urllib.request
import urllib.error
import re
data=urllib.request.urlopen("http://news.sina.com.cn/").read()
data2=data.decode("utf-8","ignore")
pat='href="(http://news.sina.com.cn/.*?)">'
allurl=re.compile(pat).findall(data2)
for i in range(0,len(allurl)):
    try:
        print("第"+str(i+1)+"次爬取")
        thisurl=allurl[i]
        file="D:/pac/sinanews/"+str(i)+".html"
        urllib.request.urlretrieve(thisurl,file)
        print("-----成功-----")
    except urllib.error.URLError as e:
        if hasattr(e,"code"):
            print(e.code)
        if hasattr(e,"reason"):
            print(e.reason)

python爬取月光博客文章下载到本地

import re
import urllib.request
import urllib.error

data=urllib.request.urlopen("http://www.williamlong.info/").read()
pat='rel="bookmark">(.*?)'
pat_url='class="post-title">

            
            
                        

            文章标题：python简单爬虫笔记            

            文章转载：http://shouzuofang.com/article/jodseg.html


    
        其他资讯
        
            
                    Python中文繁简体转换工具
                

                    Node.js中promisify()方法有什么作用
                

                    PCB叠层设计的规则是什么
                

                    AndroidStudio2.2.3通过JNI引用ffmpeg库小结
                

                    二级域名可以卖吗



    
        
            免费获取网站建设与品牌策划方案报价
            *主要业务范围包括：高端网站建设， 集团网站建设(网站建设网站制作)找网站建设公司就上四川攀枝花网站建设。
            
                
                
                
                提交需求
            
        
    
    
        
            
                联系我们
                028-86922220
                手机：13518219792
                地址：成都市太升南路288号锦天国际A幢1002号
                
                24小时服务热线：400-028-6601
            
            
                网站建设服务
                网页设计
                网站制作
                网站开发
            
            
                网站推广服务
                营销网站建设
                百度快速排名
                整站网站推广
            
            
                网站运维服务
                基础维护
                网站改版
                网站维护
            
            
                FOLLOW US
                
                
                    微信二维码
                    微信二维码
                
            
        
        
            友情链接：
            云服务器   广东网站设计   企业网站设计   娃娃鱼鱼苗   名片印刷   seo优化   四川艾名斯   邛崃做网站   注册域名   网页设计制作           
    
    
        
            
                Copyright © 2022  四川攀枝花网站建设公司     四川攀枝花网站建设公司-选我们！四川专业的攀枝花网站制作公司！
            
            
                All Rights Reserved 版权所有 蜀ICP备2024105912号-3