音声による文字入力（音声入力・音声認識）

みなさん、音声入力って使ったことありますか？

一昔前は専用ソフトを購入してから、自分の声を学習してもらうための準備（トレーニング）をして、それから利用をしていました。当然、自分の声以外はうまく認識できないので、複数の人での利用は簡単ではありませんでした。

Windows7では、[アクセサリ]-[コンピューターの簡単操作]-[Windows 音声認識]で、Windows8、Windows10では、[Windows簡単操作]の中にある[Windows 音声認識]を利用することで音声による文字入力をすることができるようになり、少しずつですが入力環境は整ってきました。

iPhoneでもiOS5から音声認識ができるようになり、iOS8ぐらいから本格的に音声入力ができてきました。Androidも4.0以降は標準として音声による文字入力ができていました。

しかし、正直ここ数年前までは入力精度や認識スピードが良いとまでは思えなかったのです。

ところが、最近の音声認識パーソナルアシスタントと呼ばれているiPhoneのSiri、Windows10のCortana、Google Assistant(ちょっと前だとGoogle Now)の性能が上がるにつれて、音声認識も格段によくなってきました。たぶん、これらの認識ソフトを使った実績のビックデータを活かして、精度があがるようになったのだと思います。

例えば、iPhoneの音声入力は40秒で一回切れますが、基本的にはどのアプリでも入力できます。しかもトレーニングが必要ないので誰もがすぐに始めることができ、かつ、複数人で入れ替わり話しても問題ありません。

Androidの音声入力はオフラインでも入力できるように設定できます。別の言い方をするとiPhoneやAndroidの音声入力はインターネットを利用しているということです。音声に関するデータベースが各社のデータセンターにあり、インターネットを介してそこからの情報を得ながら、最適な認識結果に変換しているからです。

その結果、従来のソフトとは比較にならないスピードで精度向上が進んでいるのだと思います。

スマホで試すのは業務中だとちょっとという方にはGoogleドキュメントでの音声入力をお勧めします。これはGoogle Chromeというブラウザで利用という条件が付くのですが、パソコンだけでできるというメリットがあります。

まずはマイク入力ができる環境を準備してください。ノートパソコンの場合は標準でついている場合もありますが、デスクトップパソコンの場合はパソコン用マイクを利用するか、スマホ用マイク付きイヤホン（４極）を３極にする変換ケーブルをつけるかして入力できる環境を整える必要があります。

次にGoogle Chromeを準備します。持っていない場合はダウンロードしてインストールしておいてください。次にChromeを立上げてから、Googleドキュメントのサービスに入ります。初めての方は登録手続きをする必要がありますが、無料ですし、簡単にできます。ここまでできれば、ほぼ準備完了です。

あとは新規作成（右下の＋）をクリックして、新しいドキュメントを準備したら、メニューのツールから音声入力を選びます。音声入力のアイコンが出てくるのでクリックすると入力ができるようになります。

Googleドキュメントなら複数人での共有も簡単です。会議で音声入力による議事録作成も可能です。さすがに複数人の同時は難しいですが、長い会話でない限り持ち替えて話すのであれば、かなり高い精度で入力してくれます。ただし、全部入ってしまうので要点をおさえたしゃべり方をしないと修正が多くなります。（それがしゃべり方の練習にもなりますが・・・）

スマホを持っている方はちょっとしたメモとかにも便利です。私自身はこれでメモをとることが増えてきています。みなさんもぜひお試しください。