IBMが自動音声認識のエラー率を引き下げ
IBMの研究者らは3月6日、英語での会話における自動音声認識の分野で、業界最高レベルを達成したという論文を発表した。
到達した音声認識のエラー率は5.5%。同社は昨年、業界の一里塚となる6.9%というエラー率を達成したシステムを開発していた。今般の研究はその記録を塗り替えた形となる。
さらに高い目標を目指す
今般の記録を可能にしたのは、「ディープラーニング」のめざましい進歩だ。最新モデルの特徴は、正しい例文だけでなく、誤った例文からも学習すること。
このようなシステムの開発により、数年前には14%だったエラー率が、8%、6.6%、5.8%そして今回の数値への進化していった。
しかし、同社はまだこの結果に満足していない。今回の研究で、人間の能力は5.1%以下のエラー率であることがわかったからだ。
人間は、20単語のうち1~2個の割合で聞き間違えているという。これは5分間の会話では80語となる。人間にとっては容易でも、コンピュータにとっては到達するのが極めて困難だ。
同社は人間と同等のエラー率5.1%を新たな目標に掲げ、将来的には人間の耳や声、脳の相互作用がもたらす複雑性に匹敵するような技術を創造したいとしている。
(画像はイメージです)
IBM 研究論文
https://arxiv.org/IBM 研究者ブログ
https://www.ibm.com/