音声認識(入力)アプリ比較 実務で使える?それとも限定的?
文字を入力するデバイスと言えばキーボードですが、昨今は音声による文字入力環境も整備されつつあります。果たして音声認識(入力)アプリはどの程度、実務で使えるのでしょうか。
意外と古い? キーボードの起源
普段、キーボードを使って入力をしています。ただ、キーボードはずいぶんと古い入力デバイスであるのをご存知でしょうか。
キーボードの起源は、タイプライターです。皆さんがお使いのキーボードの上から3番目の列をご覧ください。
左上から順番に【QWERTY】と表示されていますね。この並び方は『クアティー配列』と呼ばれ、タイプライターが普及していたころから変わりありません。
キーボードの起源であるタイプライターが『QWERTY配列』になった理由として、打鍵速度を制限するという説が有名です。タイプライターは物理的に連続打鍵への対応に限界がある構造なので、この説もうなずけます。
実は負担が大きい キーボード入力
皆さんの中には、一定時間内で可能な限り多く文字を打ちたいという方も多いのではないでしょうか。タイピングスキルというのは、仕事の効率に直結する要素の一つです。
打鍵速度を抑制する目的もあった『QWERTY配列』、やはり速度重視派の方には不満も多いようで、形状、配列さまざまなモデルが販売されています。
キーボードマニアなら知ってる? おすすめキーボード
簡単ではありますが、おすすめのキーボードをご紹介します。
KINESIS(キネシス)
1991年の登場以来リニューアルを続けている『コンタードキーボード』
エルゴノミクスデザインのキーボードと言えば、キネシスはとても有名でしょう。主にSEなどが好んで使用し、コンタードキーボードの
ラインアップ『Advantage2』は高額(4万円程度)ながら愛用者も多いようです。
左右分離型、ユニークな形状の『Freestyle2』
キネシスではキーボードが左右に分割されている、『Freestyle2』と言うモデルがあり、こちらは1万円台半ばとリーズナブル。
Ergodox
海外で非常に人気が出ている左右分割型キーボードです。国内でも自らキットを取り寄せて、理想のタイピング環境を目指す人もいるほど、キーボードマニアに好まれています。
キーキャップをカスタムしたり、カバーを塗装することでオリジナルのキーボードが作れます。
HHKB(PFU)
スキャンスナップで有名なピーエフユーのキーボード。すでに20年の歴史があり、熱狂的なファンがいるキーボードの1つ。
記事執筆時点(2018年11月)で、20年の歴史があるキーボード。『HHKB』の相性で親しまれますが、正式名称は『ハッピーハッキング・キーボード』です。
モデルにより違いはありますが、ファンクションキーや数字キー、矢印キーを取り払っています『Fn』キーとのコンビネーションで極力ホームポジションから離さず、高速打鍵を可能としているだけでなく、省スペースなのも好まれているモデル。
キーボードを使用することのデメリットとは?
これまでご紹介したように、各社から様々なキーボードが発売されていますが、実はキーボードには以下のような問題があります。
1.指、手、腕に掛かる負担が大きい
フェザータッチでタイピングできるスキルがある人、キーの重さが軽いモデルの使用であっても、継続して、同じような動作を行うタイピングは腱鞘炎、バネ指などの原因となります。
2.独自配列に慣れる時間が必要
左右分割型、Fnキーとのコンビネーション型などは確かに既存のキーボードより、負担軽減できる可能性があります。しかし、独自の配列を覚え直すというのは、業務に追われるビジネスパーソンにとっては厳しいものがあるでしょう。
特別なスキル不要! 手軽に導入できる『音声認識(入力)』
今回は、Mac、iPhone向けの情報となるのですが、特殊な配列、形状のキーボードが1万円以上するのに対し、導入費用が極めて低い、もしくは無料に近いのが『音声入力』です。
標準機能で『音声入力』ができるMacだけど…
Macはキーボード以外での入力、障害のある方等にも優しいOSとしての側面もあります。少しそのような話は耳にしたことがあるのですが、実際、Appleのサイトでは以下のような情報も公開されています。
スピーチ機能などは、原稿の確認などに利用しますが、調べてみると他にも便利な機能があるようです。
Macでの音声入力も期待できるのでは?と思ったものの、少し問題がありました。
オーディオインターフェース経由のマイク接続は要注意
USBのマイクがないため、オーディオインターフェース経由でマイクから音声入力をしようと試みたのですが、どうやらうまく認識されていません。今回はできるだけ簡単に入力することを目的としてますので、次の方法を試してみたいと思います。
※おそらくUSBマイクであれば設定等もスムーズですが、オーディオインターフェースは一般に相性問題が発生しやすいようです。
▼Macでテキストを音声入力する
▼音声入力したテキストが認識されない場合
Googleドキュメントなら一発OK
全く同じ環境(オーディオインターフェースにマイクをつなぐ)で、Googleドキュメントでの音声入力を試してみたところ、全く問題なく入力されました。仕事でGoogleドキュメントを使用する方も多いと思いますので、一度試してみてくださいね。
また、最近は配信、歌ってみたなど趣味でやってる方もいるのでマイク&オーディオインターフェースを所持してる方は比較的導入しやすいはず。
■使い方
1.Googleドキュメントを開く
2.空白のドキュメントを開く(新規作成)
3.『ツール』→『音声入力』
4.画面上に表示される”マイク”のボタンクリックで録音開始
iPhone標準の音声入力機能
iPhoneにも音声入力機能が備わっており、こちらの方が簡単に利用できます。”えー、間違えた…”などの細かい発話まで拾ってしまうので、注意が必要です。(Googleドキュメントは、この点は心配ありませんでした。)
■使い方
1.キーボードにある”マイク”のキーをタップ
2.地球儀のマークタップで”日本語”と”英語”を切り替え
※キーボードのマークタップで、キーボードに戻れます
▼iPhone、iPad、iPod touch で音声入力を使う
Googleの音声入力『Gboard』
音声入力では情報転送のリスクも考えないといけない
※どのアプリでも、同様のリスクあり
音声入力以外にも使用中のアプリからGoogle検索できる点など、ユニークなアプリです。ただ、肝心の精度については、長文の認識が難しいようにも感じますので、今後、一層の改善が望まれますね。
使う際に、”キーボードのフルアクセスを許可するか”と聞かれたり、音声入力がGoogleに送信される(これはiOS純正の音声入力でもAppleに送信されるので、一緒ですが…)という表示がでてきました。
このような部分を考えると音声入力は、仕事で使うのには少し躊躇する方もいるかもしれません。
シーン別 音声入力との付き合い方
iOS標準、Googleドキュメントの音声入力は実務でも、少しコツをつかめば使える印象を受けました。では、実際に活用するシーンを想定してみようと思います。
ライター
・リサーチ、取材内容のメモ
・”タイピングしすぎで指を痛めてしまった”場合の入力手段として
経営者
・移動時間、事業アイディアやタスク等のメモに
・チャットの返信に
参考:大幅アップデート! Gmailの新機能をサラッとおさらい(弊社ブログ)
※スマートリプライ機能も便利です!
フリーランス
・プログラマなど、1日のタイプ量が多い人にオススメ
・他の業務を行いながら、ヘッドセット等を経由して音声入力(メール返信等)
便利な音声入力、気になるプライバシーとセキュリティー対策
どのアプリ、機能でも”情報漏えい”のリスクがゼロとは限りません。一番、導入しやすいと感じた”Googleドキュメント”ですが、セキュリティー面の注意事項が表示されてない点だけ少し懸念事項としてありました。
”クレジットカードの番号、連絡先、機密事項などは音声入力しない”という認識でいる方が安全です。人があまりおらず、静かでセキュリティー的な問題を払拭できる場所だと認識精度もよく、
プライバシー面の問題もクリアできるでしょう。
まとめ
今回は音声入力アプリ、機能についてお届けしました。入力精度の面で実務で即使えるとは言えない部分もありますが、今後に期待できそうです。
キーボード紹介の部分で音声入力したテキストのキャプチャを添付して、この記事を終わろうと思いますが、執筆時には加筆・修正したこともあり、アイディアのメモ的な用途で使うのが良さそうですね。
▼キャパの公式Twitter・FacebookではITに関する情報を随時更新しています!
建設・土木業界向け 5分でわかるCAD・BIM・CIMの ホワイトペーパー配布中!
CAD・BIM・CIMの
❶データ活用方法
❷主要ソフトウェア
❸カスタマイズ
❹プログラミング
についてまとめたホワイトペーパーを配布中
デジタルツインと i-Constructionについての ホワイトペーパー配布中!
❶デジタルツインの定義
❷デジタルツインが建設業界にもたらすもの
❸i-Constructionの概要
❹i-Constructionのトップランナー施策