Aneiang.Pa.Core

Readme

<img src="assets/logo.png" alt="Aneiang.Pa" width="600" style="vertical-align:middle;border-radius:8px;"> 一个基于 .NET 的开箱即用爬虫库：热榜 / 特定领域 / Web API / 缓存 / 可选授权 中文 | <a href="README.en.md">English</a> <a href="https://www.nuget.org/packages/Aneiang.Pa"><img src="https://img.shields.io/nuget/v/Aneiang.Pa.svg?style=flat-square&logo=nuget" /></a> <a href="https://www.nuget.org/packages/Aneiang.Pa"><img src="https://img.shields.io/nuget/dt/Aneiang.Pa.svg?style=flat-square&logo=nuget" /></a> <img src="https://img.shields.io/badge/target-netstandard2.1%20%7C%20net6.0-blue?style=flat-square" /> <img src="https://img.shields.io/badge/status-active-success?style=flat-square" /> <img src="https://img.shields.io/github/stars/AneiangSoft/Aneiang.Pa" />

✨ 亮点特性

✅ 多平台热榜：微博 / 知乎 / B 站 / 百度 / 抖音 / 虎扑 / 头条 / 腾讯 / 掘金 / 澎湃 / 凤凰网 / 豆瓣 / CSDN / 博客园等
✅ 特定领域爬虫：Dynamic（动态数据集爬取）/ Lottery（彩票数据）
✅ ASP.NET Core Web API：开箱即用的 RESTful API（支持 数据缓存 与 可选授权）
✅ 缓存支持：None / Memory / Redis（默认 1 小时，可配置）
✅ 代理池：轮询/随机 + 认证代理，降低封禁风险

⚠️ 建议抓取间隔 ≥ 5 分钟，避免频繁抓取导致 IP 被封禁。

⚠️ 爬取的数据仅限用于个人学习、研究或公益目的。不得用于商业售卖、攻击他人或任何非法活动，否则需自行承担法律责任。

GitHub：https://github.com/AneiangSoft/Aneiang.Pa
Gitee（同步）：https://gitee.com/aneiangsoft/Aneiang.Pa
热点新闻在线 Demo：https://news.aneiang.com

DEMO代码已经开源，支持DOCKER一键部署

GitHub：https://github.com/AneiangSoft/Aneiang.Pa.News

Gitee（同步）：https://gitee.com/aneiangsoft/Aneiang.Pa.News

<details> <summary>展开：Dynamic 动态爬取完整示例（CnBlogs）</summary> </details>

Package	说明
Aneiang.Pa	聚合包，包含全部平台实现
Aneiang.Pa.Core	核心接口与模型、代理池功能
Aneiang.Pa.AspNetCore	ASP.NET Core Web API 扩展（提供 RESTful API 控制器）
--- News (热榜) ---	---
Aneiang.Pa.News	热榜聚合包，包含以下所有新闻平台
Aneiang.Pa.BaiDu	百度热榜爬虫
Aneiang.Pa.Bilibili	B 站热搜爬虫
Aneiang.Pa.WeiBo	微博热搜爬虫
Aneiang.Pa.ZhiHu	知乎热榜爬虫
Aneiang.Pa.DouYin	抖音热榜爬虫
Aneiang.Pa.HuPu	虎扑热帖/热榜爬虫
Aneiang.Pa.TouTiao	今日头条热榜爬虫
Aneiang.Pa.Tencent	腾讯热榜爬虫
Aneiang.Pa.JueJin	掘金热榜爬虫
Aneiang.Pa.ThePaper	澎湃热榜爬虫
Aneiang.Pa.DouBan	豆瓣热榜爬虫
Aneiang.Pa.IFeng	凤凰网热榜爬虫
Aneiang.Pa.Csdn	CSDN热榜爬虫
Aneiang.Pa.CnBlog	博客园热榜爬虫
--- Sectors (特定领域) ---	---
Aneiang.Pa.Dynamic	动态爬虫，可爬取任意网站的数据集合
Aneiang.Pa.Lottery	彩票数据爬虫

端点	方法	说明	示例
`/api/scraper/news/{source}`	GET	获取指定平台的热榜	`/api/scraper/news/BaiDu`
`/api/scraper/news/sources`	GET	获取所有支持的热榜源	`/api/scraper/news/sources`
`/api/scraper/lottery/welfare/{type}`	GET	获取福利彩票开奖信息	`/api/scraper/lottery/welfare/SSQ`
`/api/scraper/lottery/sport/{type}`	GET	获取体育彩票开奖信息	`/api/scraper/lottery/sport/DLT`
`/api/scraper/lottery/types`	GET	获取所有支持的彩票类型	`/api/scraper/lottery/types`
`/api/scraper/health`	GET	检查所有爬虫健康状态	`/api/scraper/health?timeoutMs=5000`
`/api/scraper/{source}/health`	GET	检查指定爬虫健康状态	`/api/scraper/BaiDu/health?timeoutMs=5000`

AneiangSoft/Aneiang.Pa.Corev2.1.7

Get Started

Readme

✨ 亮点特性

📚 目录

架构调整

安装（NuGet）

聚合包

单个功能包

已发布包

快速开始（本地 Demo）

版本与更新

在你的项目中使用

1. 注册服务

2. 使用爬虫

🌐 代理池功能（Proxy Pool）

功能特性

使用方式

方式1：通过配置文件（推荐）

方式2：通过代码配置

🚀 ASP.NET Core Web API 集成（Aneiang.Pa.AspNetCore）

安装

快速开始（只调用两个扩展方法）

缓存配置（Scraper）

授权配置（Scraper:Authorization）

方式 1：仅配置文件（推荐）

方式 2：配置文件 + 可选代码覆盖（自定义策略示例）

API 端点说明

✨ 高阶用法 - 动态爬取（Aneiang.Pa.Dynamic）

引入 NuGet

注册

使用

定义模型（CnBlogOriginalResult）

HTML 示例（节选）

特性说明

贡献

许可证

Links

Keywords

Maintainers