欢迎来到课桌文档! | 帮助中心 课桌文档-建筑工程资料库
课桌文档
全部分类
  • 党建之窗>
  • 感悟体会>
  • 百家争鸣>
  • 教育整顿>
  • 文笔提升>
  • 热门分类>
  • 计划总结>
  • 致辞演讲>
  • 在线阅读>
  • ImageVerifierCode 换一换
    首页 课桌文档 > 资源分类 > DOCX文档下载  

    用python爬取公众号推送图片并保存为PPT解决方案.docx

    • 资源ID:1123883       资源大小:28.72KB        全文页数:3页
    • 资源格式: DOCX        下载积分:5金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要5金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    用python爬取公众号推送图片并保存为PPT解决方案.docx

    # -*-coding=utf-8-*-importrequestsfrombs4importBeautifuISoupimportdatetimeimportosfromdocximportDocument#导入docx包fromdocx.sharedimportCmasword_Cm#设置页面边距fromppt×importPresentationfrompptx.utilimportCmasppt_Cmimportpptxfrompptx.utilimportInches# 图片格式列表PicJormatJist=# 创建文件夹defcreatejile():#获取系统时间curr_time=datetime.datetime.now()#将时间格式化为字符生成时间戳到时候给文件夹命名用#path=datetime.datetime.strftime(curr_time,%Y%m%d%H%M,)path=datetime.datetime.strftime(curr_time,%Y%m%d,)#检查是否存在这个文件夹ifos.path.exists(path):pass# PrintC'属于这个时间点的文件夹已经创建好!”)else:# 不存在则创建os.mkdir(path)# Print(“创建成功!正在保存图片”)#获取当前工作目录并加上之前的时间生成文件夹路径dirname=os.getcwd()+,+path+'W'returndirname#获取微信公众号图片defget_picture(url):headers=,user-agent':,Mozilla5.0(iPhone;CPUiPhoneOSll_OlikeMacOSX)AppleWebKit/604.1.38(KHTML1likeGecko)Version/11.0Mobile15A372Safari604.1,)#向刚才输入的公众号链接里面发送请求req=requests.get(url=url,headers=headers).content.decode()#获取该网页中所有的图片标签#如果这个标签内的data-src等于空的时#否则获取data-src里面的内容获取#用BeautifuISoup解析网页soup=BeautifISoup(req,lxm)res=soup.select('img,)a=0#遍历所有的图片标签foriinres:ifi.get(,data-src")=None:候直接跳过passelse:图片链接#Print(f,链接:i.get("data-src")类型为:i.get("data-type")')picjormatjist.append(i.get("data-type")#尝试去保存图片如果保存图片错误则抛出异常try:#拼接路径+a.jpga是等于数字每添加一个a自增一相当于是给图片命名并且以二进制的形式写入withopen(createjile()+f,a,i.get("data-type")",wb')asf:#向这个图片发送请求并将图片的二进制写入f.write(requests.get(url=i.get("data-src"),headers=headers).content)f.close()#关闭写入a=a+1#2自增一exceptExceptionase:#抛出异常增加程序强壮性Print(”该链接为空自动跳过!”)Print(此次一共成功保存图片a张”)#生成word文档defGenerate_word(file_name):Doc-Document()#设置页面边距sec=Doc.sections0#sections对应文档中的"节”sec.left-margi=word_Cm(0)#以下依次设置左、右、上、下页面边距sec.right_margin=word_Cm(0)sec.top_margin=word_Cm(0)sec.bottom_margin=word_Cm(0)#插入图片foriinrange(l150):path=r'.O,.format(createjile(),i,pic_format_listi)Doc.add_picture(path,width=word_Cm(21.88),height二WoreLCm(29)#Cm是厘米i+=1Doc.save(r'.0.doc×,.format(file-name)#生成PPtdefGenerate_ppt(file_name):PPT=PresentationOWjS=CoUnt_files(Create_file()#获取图片文件夹中图片数目#print(wjs)foriinrange(l1wjs):path=r,.,.format(createjile(),i,picjormatjisti)#print(path)# PPT.slideJayouts0第一个母版中的第1个样式# 添加新的一页,这个页面的版式就是括号里的ppt_slide=PPT.slides.add-slide(PPT.slideJayouts6)#这是样式是空白# left,top分别为图片左边距、顶部边距ppt_slide.shapes.add_picture(path,Ieft=PPjCm(O),top=ppt_Cm(0),height=ppt-Cm(19)i+=1PPT.save(r,.0.pptx,.format(file-name)defcountjiles(folder):#获取图片文件夹中图片数目函数file_count=len(namefornameinos.listdir(folder)ifos.path.isfile(os.path.join(folder,name)returnfile_countif_name_='_main_':#文档名称#获取微信公众号图片#生成Word#生成PPturl=input。请输入微信公众号url:1,)file_name=input("请设置文档名称:")get_picture(url)print("Saving")#Generate_word(file_name)Generate_ppt(file_name)Print:(PiJformat_list)Print(”文档创建成功!”)

    注意事项

    本文(用python爬取公众号推送图片并保存为PPT解决方案.docx)为本站会员(夺命阿水)主动上传,课桌文档仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知课桌文档(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-1

    经营许可证:宁B2-20210002

    宁公网安备 64010402000986号

    课桌文档
    收起
    展开