iPhoneに向かって話すだけで、キーボード入力と同じような文章を出力してくれるので、文書を作る仕事が大きく変わるだろう。この機能をうまく使いこなせることは、リスキリングの重要な内容だ。
音声認識に依存している人にとっては大ニュース
Siriは、iPhoneなどで用いられているiOSの音声認識機能だ。先日iOS 16.1.1が利用可能になったので、更新した。更新して10分も経たないうちに、Siriの能力がこれまでとは全く変わったことに気がついた。
ほとんど誤変換なしに文章化してくれる。いちど誤変換しても、次の文章を入力すると、その内容に応じて、すでに表示している文章を正しく変換し直してくれることもある。
2011年、AppleがIPhoneへのSiri搭載を発表 by Gettyimages
これは、私にとっては大ニュースだ。なぜなら、私の仕事は文章を書くことであり、しかも、文章作成の最初の段階で音声入力機能に大きく依存しているからだ。
ところが、これまでSiriの認識能力は不十分な場合が多く、誤変換に悩まされて続けてきた。これからは、事態が大きく変わりそうだ。それは、私の仕事の能率に極めて大きな影響を与えることになるだろう。
変換に悩まされてきたこれまで
Siriが日本語でも使えるようになったのは、2012年のことだ。これがきわめて革命的な変化であることを、私は『話すだけで書ける究極の文章法』(講談社、2016年)で書いた。
いまや、私のスマートフォン利用は、ほとんど音声入力による原稿作成だ。電話や検索、あるいは地図などよりも、はるかに多くの時間をこれに使っている。OSを交換してすぐに音声入力機能の向上に気づいたのは、そのためだ。
これまでのSiriは、極めて誤変換が多かった。したがって、音声入力で原稿を書いても、それを公表できるような文章にするために、長い修正の時間が必要だった。
音声入力するだけであれば、30分間散歩して3000字程度の文章を書くことは可能だ。しかし、それを直すために1日かかるというのが、ごく普通のことだった。
文章を修正できれば、まだいい。画面を見ずに音声入力した場合には、出力された文章が全く判読できず、何が書いてあるのか皆目わからないという場合も頻繁にある。単語が分からないだけではない。文章全体が意味不明な単語の羅列になってしまっていることもある。専門用語については、初等的なものであっても、正しく変換してくれない。
誤変換がほとんどなくなった
ところが、現在のSiriは、音声入力しただけで、読める形の文章を出力してくれる。判読不能な単語は、ほとんどなくなった。通常使われているレベルの日本語であれば、ほぼ間違いなく変換してくれる。
これまでは、同じ誤りを何度も繰り返す場合が多かった。だから、Siriは学習能力を持っていないのではないかと考えていた。しかし、いまのSiriは、ある程度の専門用語についても、繰り返し用いていれば正しく認識するようになった。ということは、学習能力を持っているのではないかと考えられる。
スマートフォンの仮想キーボードからの入力は、学習能力を持っており、頻繁に使う言葉を変換候補の先頭に置いてくれる。また、言葉の一部を入力するだけで、推測して残りを示してくれることもある。それと同じような能力を音声入力も獲得したようだ。
クリエイティング・バイ・ドゥーイング
文章を書くのに最も重要なことは、問題を捉えることだ。何についてどのような観点から書くかが重要だ。
原稿用紙に原稿を書いていた時代には、書き直しが面倒であったために、書き始める前に十分構想を練って考えを固め、それから書いていくというスタイルであった。
ところが、PCを使って文章を書くようになって、書き直しが簡単にできるようになったために、とにかく書き始めて、後からそれを何度も修正するという書き方が可能になった。こうした修正過程を繰り返しているうちに、正しい問題が何かを把握できる場合も多い。
私はこれを「クリエイティング・バイ・ドゥーイング」と称している。これは、IT時代になってから可能になった文章の書き方だ。
その書き方が、音声入力を利用することによって、もっと簡単に行えるようになる。
これまでは音声入力の性能が低かったために、この方法の有効性が限定されていたのだが、それが大きく変わった。「文章を書くほとんどの段階を、音声入力とその修正という形で進め、キーボードから文字を入力するのは最終段階」という文章執筆法の可能性が出てきた。
もっとも、実際にやってみると、キーボードによる編集に要する時間は、まだあまり短縮できない。これは、Siriの能力向上に対応する新しい使い方を、私がまだ会得していないからだろう。それが分かれば、文章を書くのに要する時間も、これまでよりは大きく短縮されるだろう。
書きにくいメールも難なく書ける
音声入力の有効性は、原稿書きに限定されたものではない。暫く前から、事務連絡は、電話ではなく、メールによって行われる場合が多くなっている。だから、メールを書くことは、ビジネスパーソンにとって大変重要な仕事だ。
そして、音声入力機能の向上は、メールの書き方にも大きな影響を与える。
これまでのSiriでは誤変換が非常に多かったので、音声入力したテキストをそのままメールで送ることは難しかった。しかし、現在のレベルでは、それが可能になっている。これは非常に大きな変化だ。短いメールであれば、音声入力するだけで、送信できるような文章が得られる。
ところで、早く返事をしなくてはいけないのに、なかなか書く気になれないメールと
いうものは多い。遅れれば遅れるほど、書きにくくなる。
これに対処する最善の方法は、音声入力でとりあえず書くことだ。まだ書き足りないと考えるのであれば、下書きにして保存しておけばよい。下書きであっても、文字の形で残っていれば、そこを出発点にして書き変えることによって、相手に出せるだけのメールになる。
何が重要なスキルかを見いだすこと
事務文書の作成について言えば、かつては、きれいな字が書けるとか、漢字を沢山知っているということなどが、重要なスキルだった。しかし、これらは、いまや、ほとんど意味がないスキルになってしまった。
それに代わって、キーボードを速く正確に打てること、スマートフォンでフリック入力ができることなどが、重要なスキルになったこともある。しかし、いまや、そのようなスキルも、あまり意味がないものになりつつある。
かつては重要だったスキルの優位性が低下する。そして、新しいスキルが重要になってくるのだ。
リスキリングとは、新しいスキルを身に付けることだ。そこでの最重要事は、何が重要なスキルかを判別することだ。
音声入力にも、特有のスキルがある。例えば、孤立した単語ごとに変換させるのではなく、意味がある長い文章を変換させることなどだ。
修正の場合には、文章の1部分だけを修正しようとすると、誤変換される可能性が高い。 そこで、一見して無駄なように思えるが、文章を全体として書き直すほうが効率的である場合が多い。また、長い文章のごく1部分だけを修正するのであれば、音声認識を用いずに、キーボードを用いるほうがよい。
業務の自動化に重大な影響
以上では文章を書くという観点から、音声認識を考えた。
普通は、音声認識機能は、文章作成というよりは、スマートフォンに対して簡単な指示を与えるために用いられる場合が多いだろう。例えば、検索。あるいは、アラームの設定などだ。
こうしたことの発展として、音声認識機能は、様々な業務自動化において、大変重要な役割を果たす。例えばコールセンターの自動化だ。この場合にまず重要なのは、人間が自然言語で電話してきた内容を、コンピュータが正しく理解することだ。
この能力が向上すれば、コールセンターだけではなく、様々な業務を自動化することが可能になる。ロボットが、人間の指示に従って、人間の音声の指示に従って行動するのだ。
音声による外国語との自動翻訳の場合も、まずは話者が話していることを正確に理解することから始まる。
日本語のハンディキャップを克服できるか?
日本語の音声認識能力と英語のそれとの間には、かなりの格差があるように思われる。
英語の場合には、利用者が多いことから、音声認識のためのデータが多量に大量に蓄積され、その結果、音声認識機能が向上しているのであろう。
Siriの場合にも、これまで日本語の音声認識能力は不十分であったが、英語の認識能力はそれよりも優れていたように思う。
こうした差は、今後も残るだろう。それだけでなく、拡大する可能性もある。
上でみたような音声認識の業務における重要性を考えると、こうした差は、日本経済のパフォーマンスに無視できない問題をもたらすだろう。これを克服することが、今後の課題だ。