• 即将更新图形学,编译原理,机器学习等文章,谢谢关注~
  • 由于算法限制,搜索时注意简化关键字,谢谢支持~
  • 网站不兼容IE5.0及以下,请使用主流浏览器访问.
  • Python爬取微博文字与图片(不使用Cookie)

    网页版微博是纯正的HTML,而且调用的微博自家的API来获取图片。

    网址:https://m.weibo.cn/api/container/即为微博api里面包含了个人的信息与微博文字与图片存储地址。

    进入api页面我们可以很清晰的看到各种信息都用json存储起来了。我们再利用python中的json库提取出来即可。这比其它利用cookie模拟登陆要方便很多,我们只要输入被爬虫用户的微博ID然后运行便能自动爬取。

    ID从这个复制链接里面可以看出来。

    代码采用Python3

    最终的效果图(爬取的微博txt文件):

    爬取的微博图片:

    以后下壁纸就很简单啦!!!

    GUI程序:http://www.omegaxyz.com/2018/02/14/python_weibo_gui/

     

    读者评分
    [评分人数: 3 平均分: 5]

    评论

    OmegaXYZ