生成AIの台頭により、業務の効率化が実現するとともに、メディアの在り方や、企業と生活者の接点のつくりかたをも変えるような大きなインパクトが予測されます。マーケターは、これらの技術をどのように受け入れ、業務に生かしていけばよいのでしょうか。8回目となる今回は、音声領域の生成AIについて、富士通の山根宏彰氏が解説します。
ユーザーの言葉を文脈で理解 音声認識の応用分野の拡張
コロナのパンデミックの際に、タッチパネルよりも衛生的との理由から、急速に広まった音声認識。また、昨今急速に広まりつつある、音声合成AI。今回は、前回の画像生成AIに引き続き、音声のドメインで、最近の動向をお伝えしたい。
まずは、音声認識に関してである。音声認識技術の応用範囲は、日常生活のあらゆる側面に及んでいる。スマートアシスタントの普及は、この技術の進歩を象徴する事例であり、ユーザーはこれらのデバイスを通じて情報を検索したり、家電を制御したりできるようになった。
また、自動車ナビゲーションシステムでは、運転中でも手を離さずに目的地を設定できる。アクセシビリティの向上においては、視覚障がい者が音声コマンドで情報を取得したり、デバイスを操作したりできるようになり、自立の支援を促すことができる。医療分野では、医師が患者情報を音声で記録し、それをテキストに変換することで、効率的なデータ管理が可能になっている。教育では、言語学習アプリが音声認識を活用して、学習者の発音を評価し、即時フィードバックが可能になった...
あと80%