[失效]微信公众号采集每天60秒读懂世界长图文教程

小竣 日常收集2,784阅读模式

由于文章中使用到的公众号《每日60s简报(dailybriefing60s)》因不可抗拒因素注销,以下接口失效。代码并未失效,根据自己开发也可以修改成获取其他公众号最新文章。

[失效]微信公众号采集每天60秒读懂世界长图文教程

微信公众号采集每天60秒读懂世界长图文教程


最近在网上发现《冷筱宇的小窝》分享的每天60秒读懂世界的长文接口。然后他的博客还提供了python的采集方法。奈何我还没学会python,我就通过他提供的py代码修改成了PHP版本。现在分享给大家。
冷筱宇的python源码地址,有兴趣的朋友可以去他那里看下=>https://www.789dl.cn/84.html

教程开始

首先你需要申请一个微信公众号,个人和企业的都可以。

然后打开微信公众号地址:https://mp.weixin.qq.com/ 并登录进去

然后我们使用chrome内核的浏览器按F12调用开发者工具来查找一下cookie
[失效]微信公众号采集每天60秒读懂世界长图文教程

我们把cookie和token 分别放入cookie和token中对应的位置

然后我们关注一下《每日60s简报(dailybriefing60s)》

这个《每日60s简报》分享的是图文,一般大概时间是5点到8点更新。

然后随便打开一个分享的文章地址https://mp.weixin.qq.com/s/5L_DT1ruWbXM6AEQQR6jhg
我们复制到浏览器中,查看一下源代码搜索__biz= 然后找到下图中的复制一下红横线的bizID《MzU5Mjk3NTgxOQ==》 biz里面对应的位置
[失效]微信公众号采集每天60秒读懂世界长图文教程

$cookie = '';
$token = '';
$biz = '';
$url = "https://mp.weixin.qq.com/cgi-bin/appmsg?token=$token&lang=zh_CN&f=json&ajax=1&action=list_ex&begin=0&count=5&query=&fakeid=$biz&type=9";
$head = array("User-Agent: Mozilla/5.0 (Linux; Android 10; YAL-AL00 Build/HUAWEIYAL-AL00) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/70.0.3538.64 HuaweiBrowser/10.0.1.335 Mobile Safari/537.36",);
//Get_Web_Contents 请到https://www.jun.la/collect/853.html获取
$a = Get_Web_Contents($url,'GET','',$cookie,'',30,$head);
$b = json_decode($a['Body'],true);
$c = file_get_contents("{$b['app_msg_list']['0']['link']}");
preg_match("|cdn_url: '(.*?)?wx_fmt=(.*?)',|",$c,$d);
print_r($d[1]);

现在接口访问是有限制的,访问请勿过快,我用crontab定时采集是每天5点到7点,每隔10分钟采集一次。然后写入MYSQL做一个判断,如果今天采集到了就不在访问接口了。还有cookie和token是有时间限制的,定期观察一下(我是写了一个cookie检测的PHP,使用宝塔的定时任务每隔30分钟检查一下,如果失效使用企业微信群机器人和MYQQ机器人API通知我,然后手动更新一下),如果失效就及时更新,防止第二天无法采集。

[失效]微信公众号采集每天60秒读懂世界长图文教程
经过这几天的对比,失效时间大概在96小时。

weinxin
我的微信
我的微信
微信扫一扫