Python模拟登陆教务处爬取课程表

本文共269个字,预计阅读时间需要1分钟。

最近正方教务处貌似升级了,网上的代码都不好使了。具体原因应该是cookie和验证码不同步。每次模拟登陆新网址时总是objective moved to here.下面是用request模块模拟登陆教务处系统的代码,并抓取课程表。(课程表直接输出来的没有输入Excel也没有美化)

代码一共有60行,注意账号和密码要自己输入。

正方的MIS系统基本上都是http://服务器地址/default2.aspx

验证码地址为http://服务器地址/CheckCode.aspx?

代码:

效果:

2 位极客在 “Python模拟登陆教务处爬取课程表” 留下足迹

  1. 最近想写爬教务系统课表的代码,可是看完mooc上北理工的爬虫课自己写还是不大会,如果可以的话想请您给一点指导。

    • 首先要看教务处用的什么系统,判断是静态网站还是用js渲染的。学习一下urllib,beautifulSoup4,Scrapy这些爬虫包。先从获取数据开始,接着学习提交数据。

评论