7大自媒体平台一键抓取!自媒体爬虫神器

自媒体人必备的数据采集利器,支持小红书/抖音/B站等主流平台

如果想单独使用某音的直播弹幕、礼物等数据,可以看我前期的文章,里面有我个人开发的网站,可以满足。

一、项目介绍

MediaCrawler由开发者NanmiCoder倾力打造,可以高效抓取7大自媒体平台上的视频、图片、评论、点赞和转发等信息。(支持小红书、抖音、快手、B站、微博、贴吧、知乎等主流平台的公开信息抓取。)

基于Python构建,已收获GitHub Star 35k+ !,通过创新性地 保留登录态浏览器环境,巧妙绕过平台加密防线,将逆向难度降低80%!

技术关键:

这套方案避免硬刚JS逆向

更多技术细节及用法请进入Github仓库查看,项目地址留在文末

二、覆盖平台与功能矩阵平台支持完整度对比

平台关键词搜索ID精准抓取二级评论创作者主页代理IP池词云生成

小红书

抖音

快手

B站

微博

贴吧

知乎

特色功能:

多种数据存储方式:

三、手把手环境搭建基础环境准备

# 进入项目目录
cd MediaCrawler

# 安装依赖(使用清华镜像加速)
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

# 安装Playwright内核
python -m playwright

运行场景1:小红书关键词采集(扫码登录)

# 关键词可以在配置文件里面修改 ,里面都有中文注释
python main.py --platform xhs --lt qrcode --type search

执行流程:

自动打开二维码登录页

使用小红书APP扫码授权

抓取关键词相关帖子+评论+点赞数据

场景2:抖音视频精准抓取(指定ID)

python main.py --platform dy --lt cookie --type detail --target-ids “video_id1,video_id2”

优势:直接读取本地cookie文件,无需重复登录

python main.py --platform xhs --lt qrcode --type search

python main.py --platform xhs --lt qrcode --type detail

python main.py --help

法律合规红线

所有使用者务必严格遵守

本工具仅限技术交流与学术研究,

严禁用于:

项目star

免责声明:本站为个人博客,博客所发布的一切修改补丁、注册机和注册信息及软件的文章仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络,版权争议与本站无关,您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。 访问和下载本站内容,说明您已同意上述条款。本站为非盈利性站点,VIP功能仅仅作为用户喜欢本站捐赠打赏功能,本站不贩卖软件,所有内容不作为商业行为。