PaddleOCR学習：PaddleOCRのインストールとテスト

9か月 ago

蓮, 翼

1 minute

PaddleOCRは、PaddlePaddleディープラーニングフレームワークに基づいて実装されたオープンソースのOCRツールです。複数の言語のテキストの検出、認識、レイアウトをサポートしており、高い精度と堅牢性を備えています。以下は、PaddleOCRのインストールとテストの手順です。

pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

git clone https://github.com/PaddlePaddle/PaddleOCR.git
cd PaddleOCR

pip install -r requirements.txt

bash tools/download.sh

python tools/infer/predict_system.py --image_dir ./doc/imgs/ --use_gpu False

これにより、./doc/imgs/ ディレクトリ内の画像をOCRで認識できます。–use_gpu Falseは、CPU環境で実行することを示します。また、他の画像をこのディレクトリに入れてテストすることもできます。

ターミナルに画像ごとの認識結果を出力し、./outputディレクトリに認識結果の画像とJSONファイルを出力します。

上記の手順で、PaddleOCR のインストールと簡単なテストが完了しました。PaddleOCR の他の機能とその使用方法の詳細については、PaddleOCR の公式ドキュメントを参照してください。