在c#中找到pdf文件中字符串的页码

在c#中找到pdf文件中字符串的页码,第1张

概述我正在开发一个pdf阅读器.我想在pdf中找到任何字符串并知道相应的页码.我正在使用iTextSharp. 这样的事情应该有效: // add any string you want to match onRegex regex = new Regex("the", RegexOptions.IgnoreCase | RegexOptions.Compiled );PdfReader 我正在开发一个pdf阅读器.我想在pdf中找到任何字符串并知道相应的页码.我正在使用iTextSharp.解决方法 这样的事情应该有效:

// add any string you want to match onRegex regex = new Regex("the",RegexOptions.IgnoreCase | RegexOptions.Compiled );pdfReader reader = new pdfReader(pdfPath);pdfReaderContentParser parser = new pdfReaderContentParser(reader);for (int i = 1; i <= reader.NumberOfPages; i++) {  ITextExtractionStrategy strategy = parser.ProcessContent(    i,new SimpleTextExtractionStrategy()  );  if ( regex.IsMatch(strategy.GetResultantText()) ) {    // do whatever with corresponding page number i...  }}
总结

以上是内存溢出为你收集整理的在c#中找到pdf文件中字符串的页码全部内容,希望文章能够帮你解决在c#中找到pdf文件中字符串的页码所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1234507.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-06
下一篇 2022-06-06

发表评论

登录后才能评论

评论列表(0条)

保存