
AI
- DOMによりAIの音声合成に生身の人間の声帯を創造し、AI音声認識は人間の聴力を有する -
誠実にアナウンスをするAI音声、おどけた表情をも見せる音声合成、そして感情をあらわにする声優の声をサンプリング・モデリングした音声合成など、もはやAIにおける技術は人間社会においては無くてはならないものとなりました。少し街を歩いたり、エンターテイメントを紐解けば、世界中はAI音声で溢れています。
しかし現在のAI音声・音声合成においての大きな課題は、機械音を感じさせる音声の線の細さと、本来あるはずの筐体が成す独特の響きを有していないことです。これは産業全体としての課題点であり、これからのAI音声を占う意味ではリアリティこそが製品価値の一部とも言えるでしょう。サウンドエンジンDOMは、AI音声そのものを根底から覆すほどの変化を与え、AI音声・音声合成に生身の人間の声帯を創造するほどのリアリティと躍動感を与えます。
力強く発音するAI音声は、人類の新たなステージの幕開けを予感させる技術です。そしてDOMのインストールされたAIは、正に20年後からやってきた未来のAI音声として人類を驚かせることでしょう。
一方音声認識においては、議事録の文字起こしからカーナビゲーションでの音声操作までを網羅し、最先端機材の多くに用いられています。現在のAI音声認識における課題点は、その音声に対しての正確な反応であり、DOMを音声認識の入力部に装備することで、AIプログラミングにとって最も聞き取りやすい音声を生成し、明確な判断ができる仕組みを構築できます。
サウンドエンジンDOMの実装イメージ図


DOMを導入したAIを使用することのエンドユーザー側のベネフィット
・全てのシチュエーションにおいて、ハッキリと音声を聴き取れる。
・伝達される意図を、間違いなく汲み取れる。
・エンターテイメントにおいては、演出される世界観に対してより深く没入できる。
DOMを導入した企業側のベネフィット
・多くの分野で用いられているAI音声合成において、時と場合により適材適所で音質をデジタルで劇的にリアルな変化を行うことにより、聴き取りやすく、クリアな音声をエンドユーザーたちへダイレクトに伝えられる。
・圧倒的な高音質化とリアリティにより、多くの場での利用価値が生まれ、市場においての優位性を確保できる。
・様々な状況での使用に対して、デジタル故の柔軟さで変幻自在な音声の在り方を追求できる為、同一空間でも変化の激しい状況に容易に対応できる。例:電車の車内案内における、地上区間とトンネル区間など、変化の激しい空間での使用に柔軟に対応。
・エンターテイメントにおいては、演出される世界観に対しての没入感を生み出せる。