【iPhone/OCR】iOS15のテキスト認識表示で画像から文字を抽出する

今回はiPhoneで使えるテキスト認識表示(ライブテキスト)っていうやつがどんなものなのか?っていうのを見ていこうと思う。どうやらこれは画像からテキストを抽出したり、そのテキストをコピー/ペーストしたりすることができるという。

ライブテキストは、写真やオンライン画像内の有用な情報を認識するため、写真やオンライン画像で強調表示されているテキストをタップするだけで、電話をかけたり、メールを送信したり、道順を調べたりできます。

iPhoneでライブテキストとビジュアルルックアップを使用する

画像内の情報を認識して便利なことができるということですね。まあ使ってみないことには分からないから、色々見ていきましょうか。

テキストの認識表示 - LiveTextとは

テキストの認識表示は画像からテキストを読み取ってコピーしたり検索したりすることができるもの。

(写真アプリにある画像からやってみると、一瞬で文字を認識してくれた)

画像から文字認識iPhoneでもできるようになってしまったんですね。こういうOCR系の機能は色んなサービスであると思うけど、個人的にはGoogleドキュメントが浮かぶ。Googleドキュメント画像突っ込むだけで文字抽出できて便利なんですよね。

それとGoogleレンズなんかも凄いから使ったことなければ使ってみるとちょっと面白いかもしれない。

今回のテキストの認識表示もそれらと同じように画像から文字を認識してくれるんだけど、使えるiPhone端末は限られている。

テキストの認識表示対応端末
  • iPhone Xs
  • iPhone Xs Max
  • iPhone XR
  • iPhone 11
  • iPhone 11 Pro
  • iPhone 11 Pro Max
  • iPhone SE 2
  • iPhone 12
  • iPhone 12 mini
  • iPhone 12 Pro
  • iPhone 12 Pro Max

割と新しめのiPhoneだろうか。これ以外のiPhoneを使っている人は残念ながら・・・自分はiPhone XRを持っているからこれを使ってこの記事では試していくよ。

ちなみに対応している言語は以下の7つ。

テキスト認識表示対応言語
  • 英語
  • 中国語
  • フランス語
  • イタリア語
  • ドイツ語
  • ポルトガル語
  • スペイン語

日本語はないけどまあしょうがない、日本語世界的に見ればマイナーだろうからなあ。

iPhoneでテキスト認識表示機能を使う - 簡単にOCR

iOS15にアップデートしたからといって、そのまま画像からテキスト認識をすることができるというわけじゃない。設定しないと使えないから早まらずに設定しよう。

テキスト認識表示をONに設定する

設定から[一般→言語と地域]と進んでテキスト認識表示をONにしよう。

これでOK、後は写真やカメラからテキスト認識表示を使いこなしてやればいいだけだ。

画像からテキスト認識を行う

さあ準備は整ったことだし何か画像からテキスト認識を行なってやろう。対応言語に日本語がないから英語のものをやってみようかな。

写真アプリから見れる画像で画像認識

写真アプリを開いて保存してある画像からテキストを抜き出してみる。画像を表示したら右下のマークをタップするとテキスト部分がハイライトされるね。

テキスト部分は普通に選択できてコピーしたり翻訳したりすることができる。

一部分を選択してコピーしてどこか別のものに貼り付けてもいいし、画像からテキストを読み取ってくれるのは結構便利。

オンラインの画像に対してテキスト認識をする

Safariなどで検索した結果出てくるオンラインの画像に対してもテキスト認識は行える。

ネットサーフィンしていて、「この画像何書いてあるか分かんねえ・・・」ってなってもテキスト認識して翻訳してしまえば、何書いてあるか理解できてしまうから楽な時代になったものだな。

カメラからテキスト認識表示を行う

次はカメラからテキスト認識を行なってみよう。といっても手元に良い感じのテキスト認識してほしいものがなんだけど、中国語で書かれたお茶を見つけたからこれでやってやる。カメラを当てるとどうやら認識してくれているようで、黄色い枠と右上にテキスト認識表示のマークが出てきますね。

テキスト認識表示のマークをタップすると、コピー・選択・翻訳などの表示が出てくる。試しにコピーしてメモに貼り付けてみると良い感じに貼り付けられますね。

ただやっぱりなんて書いてあるか分からないから、翻訳もしてみる。するとこんな風に日本語になってくれた。

なるほど、どうやら保存方法や飲む方法が書いてあったようだ。飲酒方法って書いてあるけど、これお酒じゃないんだよなあ。お茶だからお茶の飲み方が書いてあるみたい。

これカメラかざしてタップするだけでできるのは便利でいいね。日本語以外だと何いってるか分からないから、カメラですぐに翻訳することができるのは素晴らしい

手書き文字も認識してくれる

試しに手書き文字認識もやってやろう。適当に書いたものにカメラをかざしてみる。すると文字部分を認識してくれました。

これカメラの向き縦の方が認識してくれるようだね、横向きでもやってみたけどなんとも言えなかった。そしてこのテキストをコピーして貼り付けてみるとどうなるか。

うーん、やっぱり手書き文字だと完璧にはいかないのかな。まあ日本人が書いて適当英語だしなあ。もっと丁寧に書けば上手くいきそうな予感。

メモからもテキスト認識表示を行える

このテキスト認識表示はメモアプリからも使うことができる。メモから使うって何?って感じだけど、メモアプリからカメラを起動することで簡単にメモに画像から読み取ったテキストを記載できる。

テキスト認識をさせるにはメモ帳からテキスト認識表示のマークをタップすればOK。画面下にカメラが起動してカメラが読み取った文字を表示してくれる。

カメラで写すテキストによってメモに表示される内容も色々変わっていって面白い。メモにこの部分のテキスト貼り付けたいっていう部分があったら[入力]ボタンを押せばメモにそのテキストを貼り付けることができる。

これ結構凄いですね。カメラ動かしても色々テキスト認識してそのテキストをメモ帳に表示してくれる。日本語に対応していないのが残念だけど、色々便利なことができそう。(日本語のテキストをやろうとすると中国語?のような感じになってしまって意味わからなくなります。)

連絡先を読み取れば電話したりメールしたりもできる

画像に連絡先があったら、それを読み取ってそこから電話やメールをすることもできるようだね。

画像から読み取ってメールしたり電話したりってあんまりなさそうだけど、どうなんだろう。

ビジュアルルックアップも使いたかった

VisualLookUpっていう、写真に写ったオブジェクトの情報を表示してくれる機能があるんだけど、残念ながら日本じゃ使えない。ただiPhoneの設定で言語設定と地域を変更したら使うことができた。(言語変更する必要あるのかはわからない)

これでiPhoneの電源落としてもう一回つけたらビジュアルルックアップ使えるようになった。使い方は簡単で写真アプリで写真を選んで、右下のボタンをタップすればOK。そうすると写真に写っているものを検索してくれたりする。

これなかなかいいですね。「写真に写っているこれなんなん?」っていう場合に結構使えそう。

調べてくれるのはSiriが頑張ってくれているのかな。日本では使えないのが残念だけど、いつか使える時が来るかもしれないね。若干GoogleレンズやLINNELENS感があります。

まとめ

テキスト認識表示使ってみたけど、結構良いですね。簡単に画像から文字を抜き出してコピーしたり翻訳したりできるのは便利。ビジュアルルックアップも日本じゃ使えないみたいだけど、写真の中のものを知りたいときに楽に検索できて便利。そのうち日本でも使えるようになるのだろうか。

冷静にOCRって今やこんな簡単にできる時代なんだね、画像から文字の認識をするなんて難しいことやらないとできないんじゃね?みたいなイメージもはやないわ。

おすすめの記事