基于iText7的pdf文本替换工具集
License
—
Deps
4
Install Size
—
Vulns
✓ 0
Published
Feb 26, 2026
$ dotnet add package TJC.Cyclops.PdfKitCyclops.PdfKit是企服版框架中的PDF处理工具包,提供了高效、灵活的PDF文档操作功能。该工具包专注于PDF文本提取、内容分析和基本操作,为企业应用中的PDF处理需求提供了简洁而强大的解决方案。
通过NuGet包管理器安装:
Install-Package TJC.Cyclops.PdfKit
或通过.NET CLI安装:
dotnet add package TJC.Cyclops.PdfKit
无需额外配置,直接引用即可使用。
// 提取PDF文档中的所有文本
string pdfPath = "example.pdf";
string text = PdfUtil.ExtractText(pdfPath);
Console.WriteLine(text);
// 提取指定页面的文本
string pageText = PdfUtil.ExtractTextFromPage(pdfPath, 1); // 提取第1页文本
// 获取PDF文档中的文本块
List<TextChunk> chunks = PdfUtil.GetTextChunks("example.pdf");
// 遍历文本块
foreach (var chunk in chunks)
{
Console.WriteLine($"文本: {chunk.Text}");
Console.WriteLine($"位置: X={chunk.X}, Y={chunk.Y}");
Console.WriteLine($"大小: Width={chunk.Width}, Height={chunk.Height}");
}
// 获取PDF文档信息
var info = PdfUtil.GetDocumentInfo("example.pdf");
Console.WriteLine($"标题: {info.Title}");
Console.WriteLine($"作者: {info.Author}");
Console.WriteLine($"页数: {info.PageCount}");
Console.WriteLine($"创建日期: {info.CreationDate}");
// 在PDF中搜索文本
List<SearchResult> results = PdfUtil.SearchText("example.pdf", "关键词");
// 输出搜索结果
foreach (var result in results)
{
Console.WriteLine($"页码: {result.PageNumber}");
Console.WriteLine($"位置: X={result.X}, Y={result.Y}");
Console.WriteLine($"上下文: {result.Context}");
}
// 创建文本块
var chunk = new TextChunk
{
Text = "示例文本",
X = 100,
Y = 200,
Width = 150,
Height = 20
};
// 文本块比较
var anotherChunk = new TextChunk { Text = "示例文本" };
bool isEqual = chunk.Equals(anotherChunk);
// 获取文本块的边界信息
var rectangle = chunk.GetBounds();
保留所有权利