python3 爬取B站视频弹幕


声明:本文转载自https://my.oschina.net/ahaoboy/blog/1579979,转载目的在于传递更多信息,仅供学习交流之用。如有侵权行为,请联系我,我会及时删除。

需要先登录,否则不能查看历史记录

点击历史弹幕,有两个请求

包括弹幕id,返回的是所有的有弹幕的日期,格式为json

 

将timestamp提取出来

 

拼接弹幕url,点击指定日期,显示弹幕的时候有dmroll请求,获取弹幕信息

 

返回xml格式文件

 

使用re获取所有弹幕即可

import requests  """     爬取哔哩哔哩视频弹幕信息 """  # 347683 是视频的弹幕标号,这个地址会返回时间列表 url = 'https://comment.bilibili.com/rolldate,347683'  # 弹幕的id 347683 video_id = url.split(',')[-1]  # 获取json文件 html = requests.get(url) print(html.json())  # 时间戳列表 time_list = [i['timestamp'] for i in html.json()][:20]  print(time_list[:10])  # 时间戳网址 dm_rool = 'https://comment.bilibili.com/dmroll,1504368000,347683'  content = '' for i in time_list:     j = 'https://comment.bilibili.com/dmroll,%s,347683' % i     print(j)     text = requests.get(j).text     # print(text)      import re      res = re.findall('<d p=".*?">(.*?)</d>', text)      for i in res:         print(i)         content += i + '\n'  with open('content.txt', mode='w+', encoding='utf8') as f:     f.write(content) 

 

本文发表于2017年11月26日 18:36
(c)注:本文转载自https://my.oschina.net/ahaoboy/blog/1579979,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如有侵权行为,请联系我们,我们会及时删除.

阅读 2282 讨论 0 喜欢 0

抢先体验

扫码体验
趣味小程序
文字表情生成器

闪念胶囊

你要过得好哇,这样我才能恨你啊,你要是过得不好,我都不知道该恨你还是拥抱你啊。

直抵黄龙府,与诸君痛饮尔。

那时陪伴我的人啊,你们如今在何方。

不出意外的话,我们再也不会见了,祝你前程似锦。

这世界真好,吃野东西也要留出这条命来看看

快捷链接
网站地图
提交友链
Copyright © 2016 - 2021 Cion.
All Rights Reserved.
京ICP备2021004668号-1