查看原文
其他

这个元宵节,苏生不惑又更新了下脚本

苏生不惑 苏生不惑 2023-03-01

苏生不惑第404 篇原创文章,将本公众号设为星标,第一时间看最新文章。

之前分享过我写的知乎专栏文章批量下载工具更新版:整理下苏生不惑开发过的那些工具和脚本,前几天有小伙伴问为什么下载不全,因为只下载文章了,这里再更新下回答和视频的下载,下载地址在公众号苏生不惑后台回复 知乎

打开我打包的exe文件,输入知乎专栏id,就是https://www.zhihu.com/column/c_1020247688083775488 这个专栏的c_1020247688083775488 ,  可以看到下载提示。文章和回答保存到html目录,文件名是时间+标题。视频保存到video目录。默认下载的高清,代码如下:

try:
        resp = requests.get(url, headers=headers,timeout=5).text
        data = re.search(r'<script id="js-initialData" type="text/json">(.*?)</script>',resp).group(1)
        play = json.loads(data)
        playdata = requests.get(play['initialState']['entities']['zvideos'][vid]['video']['playlist']['hd']['playUrl'], headers=headers)
        print('下载视频:',title)
        with open('video/'+title+'.mp4','wb'as f:
            f.write(playdata.content)
    except Exception as e:
        print(vid,e)

顺便把专栏的文章,回答,视频数据导出excel,包含类型,标题,链接,时间,简介,评论数和点赞数:最后就是生成一份文章和回答的pdf合集。不过要合成pdf需要先下载安装这个 https://wkhtmltopdf.org/downloads.html ,如果只想把html转换pdf可以用我开发的html2pdf.exe,批量转换后的pdf文件在pdf目录。然后用我开发的pdf_merge.exe合成一个pdf文件(带书签),效果:文件名为书签,点击会跳转到对应文章。

过年的时候又整理了下我的博客https://sushengbuhuo.github.io/blog ,之前的地址打不开了,收藏下吧。

强烈推荐我一朋友:混沌之下大学期间就挣够了在江西的老婆本,在杭州买车,买房。


专注于互联网赚钱项目操盘六年,月利润做到过23w+,带出了一千多位月入过万学员。


现在,以后,玩互联网的都可以加下他,围观他的朋友圈,获取行业最新讯息,不少铁子看他的文章都赚了几十万了,值得关注,强烈推荐。


前十名关注公众号并加他V:hundunzhixia888,送月入过万搞钱秘籍一份,先到先得,手慢无。加V一定要备注【苏生粉丝】,否则一律不通过。

最近原创文章:

加入我的知识星球

视频更新版:批量下载公众号文章内容/话题/图片/封面/音频/视频,导出html,pdf,excel包含阅读数/点赞数/留言数/赞赏数

一键批量下微博内容/图片/视频,获取博主最受欢迎微博,图片查找微博博主

录制了个视频:2022年11月一键下载百度网盘/百度文库/豆丁/道客巴巴/原创力文档

更新版:整理下苏生不惑开发过的那些工具和脚本

如果文章对你有帮助还请 点赞/在看/分享 三连支持下, 感谢各位!

公众号苏生不惑

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存