通过playwright获取某平台直播弹幕

声明:

本文仅供自己学习用,如有侵权请联系本人删除。

近期在学习研究中,发现一个很棒的东西,playwright,通过该库,可以完成各种数据的获取,但是也有优缺点。

先来讲优点:

无需研究各种算法、不用玩逆向等等之类的麻烦操作。

然后讲缺点:

只能做本地化,因为它需要打开浏览器(这点不知道为什么,java端就可以设置无头模式并且可以不用安装浏览器驱动就可以运行,但是py不行,还有待研究)

我们来看看某平台直播弹幕的获取吧

运行环境:

python 3.7

playwright 1.29.0

protocbuf 3.19.4

代码,就不上了,该平台反正用的是标准的google的protocbuf进行数据传输的。然后用的gzip进行压缩。拿到数据后gizp解压,然后通过proto解析即可得到数据。实际运行结果如下图: