跳转到内容

为什么采集到的评论数比页面显示的数量少?

这是使用抖音平台进行数据采集时的一个常见现象,习惯就好。

可能的原因

评论总数包含子评论

抖音页面上显示的评论总数是包括“一级评论”与“子评论”(即回复评论)的总和,若未选择采集子评论,自然采集数量会少于页面显示数。

评论存在内容过滤或权限限制

部分评论因以下原因无法通过接口或程序正常获取:

  • 含敏感词或被用户删除;
  • 评论被设置为“仅好友可见”;
  • 评论处于“审核中”或“隐藏状态”;
  • 接口权限不足,未登录或未使用有效Token时不可见。

平台防爬机制

若采集频率过高或使用非正规手段,可能会被抖音识别为异常行为,从而:

  • 拒绝返回部分评论;
  • 提前中断数据返回;
  • 返回的数据并不完整,甚至为空。

建议做法

  • 开启“子评论采集”功能,确保获取完整评论结构;
  • 控制采集频率,设置更高的请求间隔;
  • 登录状态下采集,提高接口可见性;
  • 若对数据完整性有严格要求,建议结合人工校验或多次抓取对比。