pdf-parse 错误 05-versions-space.pdf 解决方法

2025年5月16日技巧分享评论62,143字数 693阅读2分18秒阅读模式

pdf-parse 错误 05-versions-space.pdf 解决方法

今天项目中要用到 pdf 识别文本,于是用到了 pdf-parse 这个库,结果上来就报错:

ENOENT: no such file or directory, open './test/data/05-versions-space.pdf'

去网上搜了下问题,原来是官方有一段测试代码没有删,真离谱,就是这段:

//for testing purpose
if (isDebugMode) {

    let PDF_FILE = './test/data/05-versions-space.pdf';
    let dataBuffer = Fs.readFileSync(PDF_FILE);
    Pdf(dataBuffer).then(function(data) {
        Fs.writeFileSync(`${PDF_FILE}.txt`, data.text, {
            encoding: 'utf8',
            flag: 'w'
        });
        debugger;
    }).catch(function(err) {
        debugger;
    });

}

解决方法很多,有一种就是去库中把这一段删了,但是为了避免修改依赖库的代码我就没有采用这种方案。

还有一种是导入时引入单独的库:import pdf from 'pdf-parse/lib/pdf-parse'

可以解决,但是后面可能还会报别的错误。

最简单的方法就是在项目根目录创建这个文件:test/data/05-versions-space.pdf

就可以完美解决了。

但是,我要说但是了,这个库不支持中文的识别...猝!

最后使用 pdfreader 这个库真正解决了,供参考。

新版本微信 MacOS 最新多开方法(4.0 以上) 技巧分享

新版本微信 MacOS 最新多开方法(4.0 以上)

最近有些业务需要用到另外一个微信,嫌弃手机打字慢,还是想在电脑上用微信聊天,可惜默认情况下同时只能登陆一个微信就有点烦。 以前本站写过文章,介绍如何多开微信,但是最近微信更新了底层代码,导致以前的方式...
匿名

发表评论

匿名网友

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

确定