技術の舞台裏

生成AIは、スマートフォンやタブレットを上回るスピードで普及しており、2030年までに世界経済に15.7兆米ドルをもたらすと予測されています。これは、現在の中国とインドの経済規模を合わせた額を上回ります。

私たちが取り組む理由

Aielloでは、単なる製品づくりにとどまらず、「体験」をデザインしています。直感的に使えるAI音声アシスタント「TMS Pro」、音声コラボレーションプラットフォーム「Aiello音声翻訳機」、革新的なゲスト対応ツール「GuestWeb」など、すべてのソリューションは、お客様の期待を超える体験を提供することを目指して設計されています。

AIで実現できること

生産性の向上

生活の質の向上

意味ある成果の実現

Aielloのアプローチ

AppleのSiri登場以降、音声対応テクノロジーは飛躍的に進化してきました。Aielloはそこからさらに一歩踏み込み、マルチモーダル自然言語理解(NLU)と知識・データ管理の深層学習フレームワークを構築しました。

AielloのAIは、一つの会話から複数の意図を読み取り、それぞれに対応するアクションを順序立てて実行します。これにより、会話の中に隠れたニーズにも応え、テクノロジーとの新しい関わり方を実現します。

すべての問い合わせは、顧客の業種やブランド特性に合わせて訓練された**ナレッジグラフデータベース(GDB)**に照らして処理されます。意味理解や文脈を中心に構成されたこのGDBにより、業務向けに人間らしい自然な対話を提供できるのです。

一見シンプルに見えるこのやりとりも、文脈理解によってユーザー体験は大きく向上します。

音声対話プロセス

ステップ1

音声認識(ASR)

人間の音声を自動的にテキストへ変換します。Aielloのハードウェアとマイクアレイ、端末内で動作するエッジコンピューティング対応の音声処理ソフトと組み合わせることで、ノイズ除去・エコーキャンセル・音響特徴の抽出が可能になります。この設計により、多言語対応とインタラクティブな音声体験が実現されます。

ステップ2

自然言語理解(NLU)

テキストの意味をAIが解釈し、文脈に基づいて理解する段階です。Aielloのマルチモデル分類アルゴリズムは、リクエストに応じて最適な大規模言語モデル(LLM)を選定します。

意味が曖昧な場合でも、人間のようにやりとりを繰り返すことで発話者の意図を掘り下げ、誤認識を減らします。これは、Aielloが開発を進めてきた「音声ユーザーインターフェース」技術の核心です。

ステップ3

音声合成(Text-to-Speech, TTS)

自然な発音と滑らかな音声をAIが生成し、テキストを人工音声に変換します。AielloのニューラルTTSフレームワークは、40以上の言語・方言、220以上の音声タイプに対応し、ユーザーごとにカスタマイズ可能な音声体験を提供します。

これにより、ユーザーとの対話における「最後の仕上げ」を最適化できます。

技術とソリューションについてもっと知りたい方へ

デモのご予約はこちら