OCRアプリ作成中

今、OCRアプリ作成中。
Googleで出しているMLKitってSDKがあって、これが秀逸ですごくOCRの性能がいいの。
名刺Collectionではtesseractを使ってOCRをしていたけど、時間がかかるし矩形認識にかなり手間取っていた。
結局まだ、完璧じゃない状態だった。
前回バージョンのときMLKitの存在を知りメールアドレスと電話番号のところで一部組み込んでみている。
かなり、精度がよくて、ちょっといろいろ試して見たくて、今日本語のOCR研究のためアプリを開発中。
すごいですわ、ほぼリアルタイムでいい結果が出てくる。さすがGoogleです。
今回の成果を、名刺Collectionにもフィードバックして、本当は16KBページ問題もあるのでOpenCVも外したいんだけど、矩形を取らないといけないししばらく共存だね。
多分今週末には、OCRアプリのほうは完成すると思うけど、すごいよ看板とか建物の文字まで読めるんだよ、びっくり!!
当然、プリントの類は読みまくり。
仕上げを考えているんだけど、PDFでの出力か?
最初は、よんでSNSで飛ばせればいいかと思っていたけど、どうもそれだけじゃダメみたいなのでPDF化する形を最終形にしようかなと考えている。読んで、編集して、その途中でも好きな段階でSNS送信、PDF保存出力、SQLiteデータベースにぶち込んで履歴検索、再編集可能ってところか。画質はほどほどに、OpenCVは今回は使わないようにして、とにかく16KB問題が解決しない限り外す設計をしないといけないし、いろいろやると時間がかかるから、今回はこんなところか。
名刺Collectionにもフィードバックしたいし、正直これ入れたら結構いい感じに仕上がると思う。個人利用では、最強だと思うんだが(自画自賛です。)。楽しいしね。

コメント

タイトルとURLをコピーしました