新年あけましておめでとうございます。昨年8月を最後にブログの投稿が止まっていて久しぶりの投稿ですが、今年も時間をみつけて記事を残していきたいと思います。
新年1発目はAzure Cognitive Serviceの話になりました。
それではまいります。
Contents
Cognitive Service Containerとは
Cognitive ServiceのAPI群をオンプレミス環境内で使えてしまう機能になります。詳細は以下へ。
Azure Cognitive Services コンテナーをオンプレミスで使用する – Azure Cognitive Services | Microsoft Learn
実際に使ってみた
さて、今回はCognitive Service Containerの中でもOCRコンテナを試してみたいと思います。
ここからの手順は以下のチュートリアルに沿っています。最新の手順は以下Docsを確認ください。
Computer Vision 3.2 GA 読み取り OCR コンテナー – Azure Cognitive Services | Microsoft Learn
前提として、手元環境でDockerが利用可能な状態とします。
Azure Cognitive Service – Computer Visionリソースの作成
![](https://i0.wp.com/www.simpletraveler.jp/wp-content/uploads/2023/01/image-10.png?resize=728%2C719&ssl=1)
フォームの申請
Docsによると、現在は以下フォームから申請することで利用できるようになるようです。承認は開発チームにより行われ、10営業日以内に利用可能になるようです。
Computer Vision 3.2 GA 読み取り OCR コンテナー – Azure Cognitive Services | Microsoft Learn
![](https://i0.wp.com/www.simpletraveler.jp/wp-content/uploads/2023/01/image-1.png?resize=728%2C600&ssl=1)
Dockerイメージのダウンロード
Azure Cognitive Services Computer Vision Read OCR by Microsoft | Docker Hub
![](https://i0.wp.com/www.simpletraveler.jp/wp-content/uploads/2023/01/image.png?resize=728%2C241&ssl=1)
docker pull mcr.microsoft.com/azure-cognitive-services/vision/read
![](https://i0.wp.com/www.simpletraveler.jp/wp-content/uploads/2023/01/image-2.png?resize=728%2C301&ssl=1)
コンテナの実行
Computer Vision 3.2 GA 読み取り OCR コンテナー – Azure Cognitive Services | Microsoft Learn
docker run --rm -it -p 5000:5000 --memory 16g --cpus 8 \
mcr.microsoft.com/azure-cognitive-services/vision/read:3.2-model-2022-04-30 \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}
コンテナが実行されていることの検証
Computer Vision 3.2 GA 読み取り OCR コンテナー – Azure Cognitive Services | Microsoft Learn
実行開始後、localhost:5000にアクセスすると・・・コンテナが実行されていることが分かります。
![](https://i0.wp.com/www.simpletraveler.jp/wp-content/uploads/2023/01/image-3.png?resize=728%2C417&ssl=1)
localhost:5000/statusにアクセスすると、APIキーが有効かどうかが分かります。
![](https://i0.wp.com/www.simpletraveler.jp/wp-content/uploads/2023/01/image-4.png?resize=728%2C96&ssl=1)
localhost:5000/readyでは、コンテナがクエリを受け取る準備ができているかが分かります。
![](https://i0.wp.com/www.simpletraveler.jp/wp-content/uploads/2023/01/image-5.png?resize=728%2C116&ssl=1)
localhost:5000/swaggerでは、コードを記述することなくAPIを試すことができるようになっています。これは便利ですね。
![](https://i0.wp.com/www.simpletraveler.jp/wp-content/uploads/2023/01/image-6.png?resize=728%2C488&ssl=1)
APIの実行
試しにこのSwagger MenuからAnalyze APIを実行してみる。Web上で利用可能になっていたサンプル請求書pdfのURLを記載してAPIを実行してみると・・
![](https://i0.wp.com/www.simpletraveler.jp/wp-content/uploads/2023/01/image-7.png?resize=728%2C511&ssl=1)
レスポンスコード202とともに、operation-locationタグ内に結果のURLが含まれて返ってきました。
![](https://i0.wp.com/www.simpletraveler.jp/wp-content/uploads/2023/01/image-8.png?resize=728%2C242&ssl=1)
このURLにアクセスすると・・OCRで読み取られた結果が返ってきていることが確認できました!
![](https://i0.wp.com/www.simpletraveler.jp/wp-content/uploads/2023/01/image-9.png?resize=728%2C272&ssl=1)
以上、Cognitive Service ContainerのOCRコンテナを利用してみた、の記事でした。
少しでも参考になりましたら幸いです。
おしまい
コメントを残す