第633回 AIを駆使した音声認識開発企業の製品群―5年ぶり訪中見聞記(下) 伊藤努

第633回 AIを駆使した音声認識開発企業の製品群―5年ぶり訪中見聞記(下)
中国安徽省の省都・合肥で大手電気自動車(EV)メーカー、上海蔚来汽車(NIO)の生産工場の次に視察したのは、人工知能(AI)を使った自動翻訳をはじめとする音声認識などの最先端技術開発で国際的に知られる中国大手企業「科大訊飛(アイフライテック)」の展示体験施設だ。
音声認識では世界でトップレベルの企業といわれているAI企業「科大訊飛」について、わが国ではまだあまり知られていないと思われるので、簡単に紹介させていただく。中国AI企業の大手4社の一角とされる同社は、AI分野の中で技術が専門分化ししつある音声認識で頭角を現している企業だ。
音声認識とは、人がスマートフォンに声をかけるとスマホが応答する仕組みの重要な技術。コンピューターには「聴力」がないので、音声認識技術が搭載されていないスマホなどコンピューターに人が声で話しかけても理解できない。しかし、音声認識技術を搭載すれば、人の声を波形として捉え、それを文章に変換することができる。文章になれば、コンピューターに搭載されているAIが単語や文脈などから情報を拾って、意味を把握できる。AIが話者(人)の意図を推測できれば、AIは情報を集めて回答をつくることができる。その回答はまだ文章なので、音声認識技術は今度は「文章→波形→音声」という順番で音声をつくり、話者に語りかけるという仕組みだ。
「科大訊飛」が長年をかけて開発した音声認識の正答率は当初、6割程度にすぎなかった。それが現在は95%に達している。「科大訊飛」の音声認識技術のデモンストレーションでは、中国人がマイクに向かって中国語を話すと、モニター上に次々その言葉通りの中国語が書かれていく。しかも、ほぼ同時に英語訳も書かれていくのである。
合肥にある同社の展示施設を訪ねると、最先端技術の開発企業らしい現代的なビルの入り口で大きな液晶パネルの画面に映った女性のアバター(分身のキャラクター)の出迎えを受けた。本物の若い中国人女性と見まがうばかりの容姿で、よく見ないと、本物かアバターかの区別がつかないほど精巧なつくりに驚く。
◇音声自動翻訳から囲碁対局ソフト、学校の授業支援……
さて、大型コンピューターのディスプレーやタブレット、スマートフォンなどさまざまなAI機器がコーナーごとに設置された展示施設では、最初に中国語などから80以上の他言語を瞬時に翻訳することができるアプリが内蔵されたスマホが紹介されたのに続き、多言語AI透明スクリーンと銘打ったコーナーに立ち寄ると、人が話す音声がそのまま文章化され、クリックすれば他言語にも翻訳されていく様子を見ることができた。筆者ら一行を案内してくれた女性スタッフによれば、スクリーンにはカメラが装着されており、話す人の顔の動きと口の動きも利用してこのような正確な音声翻訳が可能となるよう開発されたという。外国人も加わった企業などの会議や打ち合わせで音声翻訳機器を利用すれば、通訳者も不要となり、会議参加者の意思疎通も格段に向上するのは請け合いだ。
さらに、個人の外国人旅行者にとっても、このアプリ内蔵のスマホを持っていれば、旅行先でのレストランでの食事の注文などさまざまな場面で使える便利な翻訳用のツールとなる非常に便利だろう。
また、案内役の女性の実演では、新聞記事や書籍の文章をスキャンしてすぐに他言語に翻訳することも可能で、現在の機種では多数の言語が翻訳の対象となっている。翻訳の精度は中国語の場合は98%に達しており、英語は95%、他の言語は90%前後とのことで、今後のAIを使ったさらなる開発の取り組みでその精度をさらに高めていくことが期待できる。ただ、筆者とともにこの展示施設を視察した訪中団一行のメンバーの多くが中国での特派員経験者を含むベテランのジャーナリストで、普段の仕事でも記者会見での要人発言や国際会議での講演などを録音した上で、「文字起こし」という形で音声記録を文章化する先端ツールを利用しており、「科大訊飛」が製品化しているさまざまなAI機器と類似のアプリはわが国でもすでに実用化されている。
この展示体験室では、個人利用者や企業関係者向けの音声自動翻訳のほか、囲碁の対戦で利用者それぞれの実力ごとの有段者に対応したソフトも開発されており、筆者らの一行のメンバーが囲碁3段の資格と名乗って黒い碁を盤上に置くと、AIを内蔵した機器がレバーを使って白い碁を置いていくという具合に対局が進んでいく。このほか、展示ルームには、▽学校での教師による算数・数学、歴史などさまざまな科目の授業支援にも対応できるAI機器、▽学校での生徒・学生の試験答案に対する採点・評価や作文・論文の添削支援に対応するAI機器、▽「西遊記」など古今東西の小説の全文とあらすじの紹介やその他言語への翻訳、テレビドラマの映像再現――といったAIを使ったさまざまなソフトなどが開発されていることが紹介され、いずれのメニューでも案内役の女性がマウス代わりの指示棒を使って実演してくれた。
どれもこれも筆者がこれまでは実際に目にしたことのない最先端のAI機器の機能の高さに驚くことの連続だった。そうした中で、生徒の試験答案の採点や作文・論文の添削支援のソフトについてだけは、多くの生徒や学生を指導する教師側の労力負担の軽減には大いに役立つ面はあるとはいえ、答案などを懸命に書いた生徒たちへの指導をAI機器に丸投げしてしまう危険性もあるのではないかと感じたことも付言しておきたい。
《アジアの今昔・未来 伊藤努》前回
《アジアの今昔・未来 伊藤努》の記事一覧