2020-08-29から1日間の記事一覧

pdfminerでpdfから文字情報の取り出し

pdfminer で pdf から文字情報を取り出す。 インストール pip install pdfminer.six pip install chardet sixにしないと日本語が認識されないので注意 参考: https://techacademy.jp/magazine/22374 例1 #coding: utf-8 import io import os from pdfminer.…