weixin_sogou

爬取微信公众号文章

  • 所有者: iberryful/weixin_sogou
  • 平台:
  • 許可證: MIT License
  • 分類:
  • 主題:
  • 喜歡:
    0
      比較:

Github星跟蹤圖

weixin_sogou

爬取微信公众号文章

服务地址: WeiRSS

UPDATE: 目前因为搜狗微信接口调整,服务处于不稳定状态...

依赖

  1. Python 3.4+
  2. BeautifulSoup
  3. requests
  4. selenium
  5. phantomjs

使用说明

搜狗微信搜索平台搜公众号名称,在url里获得公众号的openid

get_account_info() 获取账号信息,可传入openid、url、cookies

parse_list()获取文章列表,可传入openid、link

parse_essay()获取文章内容,传入文章链接

update_cookies()更新cookies,触发反爬虫时使用

示例

open_id = 'oIWsFt3nvJ2jaaxm9UOB_LUos02k'
cookies = update_cookies()
print(get_account_info(open_id,cookies=cookies))
#{'description': '一个基于内容分享的社区——「交流故事·沟通想法」', 'logo'...
print(parse_list(open_id))
#[{'link': 'http://mp.weixin.qq.com/s?__biz=MjM5NjM4OTAyMA==&mid=206650

主要指標

概覽
名稱與所有者iberryful/weixin_sogou
主編程語言CSS
編程語言Python (語言數: 4)
平台
許可證MIT License
所有者活动
創建於2015-06-22 12:49:33
推送於2015-10-01 00:35:00
最后一次提交2015-09-30 20:34:55
發布數0
用户参与
星數752
關注者數55
派生數200
提交數6
已啟用問題?
問題數6
打開的問題數4
拉請求數0
打開的拉請求數0
關閉的拉請求數0
项目设置
已啟用Wiki?
已存檔?
是復刻?
已鎖定?
是鏡像?
是私有?