イメージ
イメージ
キヤノンマーケティングジャパン presents Solution in my life
カラー
カラー
カラー
Every Monday 8:38 〜8:48
Every Monday 8:38 〜8:48
「ITの浸透により、人々の生活をより良い方向に向かわせる」
そんな概念である“デジタルトランスフォーメーション”と
いう言葉が広がり、
私たちの暮らしは、より豊かに、より便利に、
日々ポジティブに変化しています。
このコーナーでは、暮らし、仕事、社会、私たちの身近な
ところにあるデジタル化の動きを紹介していきます。
2024年度以降はこちら
2021 10.11
AIを活用した音声認識技術の最前線

null
このコーナーでは「暮らし、仕事、社会」、私達の身近なところにあるデジタル化の動きをご紹介しています。
今日は、文字起こしツールの最新事情とAIの音声認識技術の現状と可能性について取り上げます。

AIの技術は今、様々な分野で活用されています。そんななか、私たちの生活の中で広く浸透しているものの一つがAIによる音声認識です。音声をテキスト化する、いわゆる「文字起こし」もその中のひとつですよね。会議の議事録作成や取材の時に活用されている方もいらっしゃるのではないでしょうか。

そこで今回は、文字起こしツールの最新事情とAIの音声認識技術の現状と可能性について、世界トップクラスの音声認識技術を持つiFLYTEK JAPAN AI SOLUTIONS株式会社の取締役副社長兼COO 孫嘉人さんにお話を伺いました。

孫さんに、音声認識の現状について伺ったところ、2012年頃からディープラーニングの技術の進化によって、音声認識の精度は何倍にも上がってきているそうです。
また、需要も広がっており、会社の議事録だけでなくコールセンターで対お客さんのサービス向上だったり、自動運転やその中での自動音声案内だったり、DX対策向けの需要など、様々な分野で需要が高まっているそうです。

そんなAIの音声認識技術の課題について孫さんに伺ったところ、音声認識の精度が今一番重要な課題だとおっしゃっていました。
例えば、静かな環境での会議や、人が発した音声がはっきりしている場合は、まあまあ高い認識精度になるんですが、普段の利用環境、静かな場所ばかりではなく雑音とか周囲に他の人がいて喋っていたりすると、高い認識率を実現するのは非常に難しいそうです。

そんな課題を抱えつつ、孫さんの会社で開発されたのが、音声を自動でテキスト化する次世代のボイスレコーダー「VOITER」なんです。その特徴について孫さんに伺いました。
「一番の特徴は6つのマイクと2つの指向性のあるメインマイク、8個のマイクを搭載しているところ。
6つのマイクは発声された方向を特定する役割と雑音を処理する役割を持っています。雑音除去の技術は世界の国際コンテストで1位優勝している技術を使っています。
文字起こし、音声認識の技術は、日本国内に設置してあるクラウドサービスと通信して、クラウド側で音声認識の処理を行っています。
そこで使っている音声認識のエンジンもこれまでに蓄積してきた技術を使っています。その技術も音声認識の国際コンテスト「CHiME」で3回連続1位を獲得しています」

この「VOITER」、本体は税抜きで49800円。日本では新発売ということで最初の一年間は文字起こしの利用は無料だそうです。
2年目以降は月額で2180円(税込)などのプランが準備されているそうで、毎月3時間無料のべーシックプランもあるそうです。

ライターさんや大学の先生など個人の方はもちろん、企業や自治体などからの問い合わせもたくさんあるそうで、こんな声も寄せられているそうです。
「やはり議事録。大量な時間をかけていたのが、「VOITER」を使って非常に効率良く短時間で出来るようになった。これは非常に嬉しいですね。
あと、問い合わせが多いのが、聴覚障害の方からのお問い合わせ。例えば、コミュニケーションの時に、喋りながら相手の声をリアルタイムで、文字で書き起こしできると、コミュニケーションの課題解決につながるじゃないかという声は結構多いです」

文字認識の技術が向上することで、文字起こしはもちろん、いろいろな可能性が広がりますね。最後に、今後の展開についてお話をうかがいました。
「私たちの貢献できるところで言いますと、やはり今後、日本のDXのところに関しては、私たちの音声認識・AI音声技術を使って、企業様のDX対応の中のひとつの要素技術として展開できたらと思います。
例えば入力の手段として音声認識をして、その後は、様々な分野での自動分析ですとかデータマイニングとか、顧客のニーズの自動分析、そこのタイムリーなサービスの提供、サービスの改善とか、そういった分野には、製品あるいはAIソリューションの形でお役に立てるよう、製品とAIソリューションを提供していきたいと考えています」

AIの音声認識の技術って、様々なシチュエーションで活用できそうですよね。これからは、その用途も広がって、私たちの生活をいろいろ変えてくれるのではないかと感じました。

孫さん、貴重なお話、ありがとうございました。

ツイッター Facebook
Top