awesome-python-login-model

?python模拟登陆一些大型网站,还有一些简单的爬虫,希望对你们有所帮助❤️,如果喜欢记得给个star哦?

Github星跟踪图


?Website login model

?收集了一些各大网站登陆方式, 和一些网站的爬虫程序,有的是通过selenium登录,有的是通过抓包直接模拟登录,有的是利用scrapy,希望对小白有所帮助,本项目用于研究和分享各大网站的模拟登陆方式,和爬虫程序,会持续更新。。。

About

模拟登陆基本采用的是直接登录或者使用selenium+webdriver的方式,有的网站直接登录难度很大,比如qq空间,bilibili等如果采用selenium就相对轻松一些。

虽然在登录的时候采用的是selenium,为了效率,我们可以在登录过后得到的cookie维护起来,然后调用requests或者scrapy等进行数据采集,这样数据采集的速度可以得到保证。

Completed

catalogue

Test

Please touch here to view test images

Informations

  • 为感谢你们的支持,准备写一套免费爬虫的教程,保证你学会以后可以爬取市面上大部分的网站,教程地址

tips of pull request

  • 欢迎大家一起来 pull request ?

Problems

  • 关于验证码:本项目所用的方法都没有处理验证码,识别复杂验证码的难度就目前来说,还是比较大的。以我的心得来说,做爬虫最好的方式就是尽量规避验证码。
  • 代码失效:由于网站策略或者样式改变,导致代码失效,请给我提issue,如果你已经解决,可以提PR,谢谢!
  • 正在对部分代码进行优化。。。
  • 如果该repo对大家有帮助,给个star鼓励鼓励吧

?Life is fantastic?! bro?~

Acknowledgments

@deepforce, @cclauss, ksoeasyxiaosi

  • 欢迎更多的人来提pr~
  • Thanks for all ?

联系我

注意:

  • 本项目仅用于学习和交流

欢迎任何人参与和完善:一个人可以走的很快,但是一群人却可以走的更远

主要指标

概览
名称与所有者Kr1s77/awesome-python-login-model
主编程语言Python
编程语言Python (语言数: 1)
平台
许可证Other
所有者活动
创建于2019-01-20 10:43:13
推送于2022-07-26 16:22:57
最后一次提交2021-07-24 10:08:34
发布数0
用户参与
星数16.1k
关注者数447
派生数3.3k
提交数175
已启用问题?
问题数111
打开的问题数68
拉请求数13
打开的拉请求数10
关闭的拉请求数11
项目设置
已启用Wiki?
已存档?
是复刻?
已锁定?
是镜像?
是私有?