はじめに
今日は、OCR(Optical Character Recognition/Reader)であるCopyfishと言うアプリについて紹介します。
この記事を読むと次の疑問について知ることができます。
★Copyfishの無料版と有料版の違いは何が違うの?
★Copyfishに対応した拡張機能の対応ブラウザーにはどのようなものがあるの?
★Copyfishのインストールはどうすればよいの?
★Copyfishの使い方はどうするの?
・Copyfishの言語設定
・実際に試してみたよ
英語
日本語
パソコンのOS、機種などで説明の仕方が変わってくることがありますので、私の使用しているパソコン環境について記しておきます。
パソコンOS : Windows10 Pro
Windowsバージョン : 20H2
OCRのCopyfishとは?
Copyfishは、光学的に画像やPDF文書などの文字を認識して使えるようにするアプリなんです。
一般に画像やPDF内の文字は、読んで認識はできますがその中の文字を取り出してパソコンなどで利用はできません。
それを可能にするソフトがOCR(光学的文字認識)アプリであり、Copyfishもそのうちの一つですが、このアプリの特徴は、ブラウザーの拡張機能として働き、ブラウザー上から認識したい部分を指定してその部分の文字認識をしてくれるのです。
Copyfishは、2015年10月に最初に公開され、多くのGoogle Chromeユーザーに利用されているようです。
このソフトウェアは、GPLオープンソースライセンス(GNU General Public License)の下で公開され、Githubが管理運営をしているようです。
Copyfishの無料版と有料版の違い
Copyfishには、2つの有料版があります。
無料版と有料版の違いを表にしました。
Copyfish 無料版 | Copyfish PRO版 | Copyfish PRO+版 | |
月額料金 | 0円 | US$ 19.95 | US$ 29.95 |
7日間の無料トライアル | ー | 〇 | 〇 |
標準のOCR機能 | 〇 | 〇 | 〇 |
自動言語検出機能 | × | 〇 | 〇 |
強力なOCR機能(例えば、手書きなど) | × | 〇 | 〇 |
Google翻訳機能 | × | × | 〇 |
サポート | ファオーラム | フォーラム、メール | フォーラム、優先的なメールサポート |
Copyfishに対応した対応ブラウザー
このCopyfishは、ブラウザーの拡張機能として動作するようになっています。
対応するブラウザーは、Google ChromeとMozilla Firefoxとされていますが、最近のMicrosoft Edgeであれば、Chromeの拡張機能を取り込むことができますので、恐らく利用可能であろうと思います。
Microsoft Edgeについては、次の記事を参照ください。
Copyfishのインストール
Google Chrome、Mozilla Firefox、Microsoft Edgeの3つのブラウザーに対してインストールしてみたいと思います。
Copyfishの使い方
以後の操作は、Chrome版のCopyfish拡張機能で解説していきます。
ここでは試していませんが、Copyfish Pro+であれば、英語の文書を文字認識して、Google翻訳機能で出力を日本語でしてもらうということも可能になります。
有料版にすると、自動的に言語を検出してくれて、OCRをしてくれますが、無料版では入力言語、出力言語を指定してやる必要があります。
Copyfishの言語設定
拡張期のバーCopyfishのアイコンの上で右クリックして、「オプション」をクリックします。
●英語のOCRをする場合
- OCR Engine : Free OCR Engine 2 (better alphanumeric OCR)にチェック
- Translate to 「English」を選択
●日本語のOCRをする場合
- OCR Engine : Free OCR Engine 1 (more languages)にチェック
- Input Language (OCR Language) 「Japanese」を選択
- Translate to 「Japanese」を選択
実際に試してみたよ
Chromeブラウザーで文字認識したいページに移動して、Copyfishをクリックして、文字認識したい部分を囲ってください。
英語
ここでは、WordPressプラグインの「Elementor Website Builder」の説明の英語の一部をクリップボードにくりぬいた画像を以下に示します。
そして、それをOCRした結果は、次の通りです。
Whether you're a web designer looking for a way to achieve pixel-perfect
websites, a marketer looking to get online fast or a developer who wants
to expand their capabilities, Elementor's website builder has what you
need intuitive drag-and-drop Editor, advanced design features and a
full open-source approach.
OCRの結果で原文と違うところを探すと、「& Page」⇒「&Page」となって、半角スペースが取り除かれているのと、「need - intuitive」が「need intuitive」となっており、need とintuitiveの間の「ー」が取り除かれている2つだけであり、英語単語自体のスペルミスなどはありませんでした。
したがって、通常の英文のOCRとしては十分使えると言えます。
日本語
ここでは、私のブログの「Runmifit」の記事の一部をクリップボードにくり抜いた画像を以下に示します。
そして、それをOCRした結果は、次の通りです。
なお、下の赤の「CHECK」が、結果を貼り付ける際に普通に「貼り付け」をした場合で、緑の「CHECK」が「プレーンテキストとして貼り付ける」をした場合ですので、OCR結果を貼り付ける際は、「プレーンテキストとして貼り付ける」をしたほうが良いでしょう。
nmⅲtの評判を見るには、最も簡単なのがGoogPlayやAppleSto「eでRunmifitのアプリをダウンロ
4.3(レヒュ-総数248件)
2.6(レビュ-総数2ノ10件)
-ドする際に表示される、評価とレビュ-を見ると-番分かり易いです。
GoogleplayでのRunmifitの評イ面
AppleStO「eでのRunmifitの評価
上述の結果から、App厄とAnd「oidでの評価に少し違いがみられます。
できます。
これは、nmⅲtそのものがまだまだメジャ-なアプリではないからで利用者も少ないのだろうと予測
TwitterやFacebookで「nmⅲtの評判」で検索しましたが、でてこきませんでした。
And「oidでのRunmifitの評価が低い結果となっています。
And「oidでのレビュ-数が多いので何とも言えませんが、Ap酬eでのnmⅲtのま平価は高いですが、
日本語のOCRでは、赤のマーカーで示したように英語の部分が正確に文字認識がされていないことが分かります。
また、レイアウトが崩れてしまっています。
これは、入力と出力を日本語にしているからであり、無料版ではしょうがないことなのかもしれません。
次は、日本語だけの画像を切り抜いた場合はどうなるかを見てみたいと思います。
下図は、朝に散歩したことをツイートした部分をTwitterから抜き取った画像です。
3,925歩、2.66m、89kc引
皆さん、おはようございます。
今日も頑張りましよう
おわりに
皆さんいかがだったでしょうか?
OCRのCopyfishとはどのようなアプリなの?、Copyfishの無料版と有料版の違いは何が違うの?、Copyfishに対応した拡張機能の対応ブラウザーにはどのようなものがあるの?、Copyfishのインストールはどうすればよいの?、Copyfishの使い方はどうするの?、Copyfishの設定、実際に試してみたよ、英語、日本語などについて解説してきました。
この記事が少しでも皆様のお役に立てればこれほど嬉しいことはありません。
以上です。
コメント