「Hey Siri」「OK Google」とスマホや機器に日常的に呼びかけることが自然になってきた昨今、注目されているのが「VUI」です。
VUIとは、Voice User Interfaceの略で、声を使ってあらゆるやりとりや操作を行うことを指します。
なんとなく体感として声を使ってスマホなどを操作することが多くなってきたな、と思っている人は多いかもしれませんが、実際にそのメリットや、どんなところに使われているのかを意識したことがある人は少ないかもしれません。今回は、VUIについて解説していきます。
目次
1. VUIって?
VUIは音声認識機能を使用したインターフェースのことで、今や私たちの生活のあらゆるところに溶け込んでいます。
今まではマウスやキーボードを使って入力するCUIと呼ばれる入力方法が主でしたが、VUIの登場により今はスマホなどに話しかければ操作ができるようになりました。
スマホやタブレット端末では、私たちの手を使って直接端末や画面を触ることで操作をします。これはNUI(Natural User Interface)と呼ばれ、普段行っている動作を使って機器を操作させるインターフェースを指しています。
VUIもNUIの一種で、より日常的な動作で製品を自然に使用できるようにするものです。
2. VUIが使われている製品
すでに身近なものとなっているVUIですが、実際にVUIが使われている製品を見てみましょう。
2-1. 音声アシスタント
私たちの身近な例で言えば、AppleのSiri、Googleアシスタント、Amazonのスマートスピーカーのアレクサが最も想像しやすいVUIではないでしょうか?スマホを持っている人なら、大体の人は一度はボイス入力機能でアシスタントを使ったことがあると思います。
AmazonスマートスピーカーやGoogleホームでは、調べ物をしたい時、音楽を聴きたい時などに機器に呼びかけると、搭載されているアシスタントがその命令を実行してくれます。
スマートホームといった、家の設備と連動している場合は電気を付けたりという時にもとても便利ですね。
2-2. スマート冷蔵庫
VUIがIoTと一緒に話題になったこともあり、家電に組み込まれていることも多くあります。
例えば、LGが発売しているSmartInstaViewは音声アシスタント機能を内蔵しており、様々な操作が音声を使って行えるようになっています。
SmartInstaViewではAmazonを使った食材の注文も冷蔵庫に話しかけるだけでできますし、レシピの検索までしてくれます。
料理中は料理で手が塞がっているので、なかなか手を使った機器操作が難しいですが、音声アシスタント機能があればいちいち手を止める必要がないので非常に便利ですね。
参考:https://techable.jp/archives/51771
2-3. カーナビ
カーナビもVUIが生かされる分野です。運転中は手が離せないものですが、ドライブの道順を調べたり、今から行こうとしている天気を調べたり、また音楽をかけたりといったことをしたくなるものです。しかし、スマホを見ながらの運転は非常に危険ですし禁止されていますよね。
LINEがトヨタと連携して出したカーナビアプリではそれが可能となっており、ドライブ中でもスマホの画面を見ずに色々な操作ができるので安全にも繋がるものとなっています。
AIアシスタント「Clova」の技術を使っており、今はアプリでの使用ですが、近いうちに実際の車にも搭載されるようになるでしょう。
https://geo-news.jp/archives/319
3. VUIのメリットは?
VUIによってもたらされたメリットは多くあります。
代表的な3つをご紹介します。
3-1. 面倒な操作が不要
音声アシスタントを思い浮かべてもらえれば想像しやすいですが、VUIは圧倒的に操作数の削減に寄与します。
例えば料理のレシピを調べたい場合、今までなら、もしその時に何か作業していて手が汚れていたらまず手を洗って拭いてから、スマホでネットを開き、「○○ レシピ」と検索窓に打って検索。適当な結果を選んでページを開く、というのが普通のフローでした。
それが、VUIになれば手を止めて手を洗ったりする必要もなく「○○のレシピ調べて」と言えば、アシスタントが教えてくれます。
面倒な操作が一切いらなくなり、よりいっそう利便性が増しました。
3-2. インターネットを使える人が増える
今までのスマホなどでは、手を絶対に使わないといけない、もちろん字も読めないと使えないものでした。しかしVUIの普及により、障害などで手が不自由な人、または字は読めないが音声なら大丈夫という人がVUIを通してインターネットを使えるようになりました。
また、話しかけるだけ、というのはキーボード入力などの手間が不必要なので製品を使う学習コストが低いとも言えます。
例えばどうしてもキーボード入力が覚えられないという人も、いつものように話しかけるだけで操作できるのであれば使えるはずです。
本などの読み上げ機能なども充実してきており、より多くの人がインターネットを通じて娯楽を楽しめるようになるでしょう。
3-3. 自然に製品を使ってもらえる
VUIの製品は家などにおかれることが多く、より日常生活と密接なものになっています。
その製品の性質上、外でずっと喋りながら機械を操作したいという人は少ないので、必然的にVUIが使われているのは家の中や車で使われるような製品が多くなりますが、そのためより日常に溶け込むものになっています。
また、ソフトバンクのPepperくんや、時たまショッピングモールや空港で見る案内ロボットもVUIで操作することが可能なことが多く、様々な人が話かけている姿を見られます。これが「キーボードで入力してください」だと入力の手間が多く少し躊躇ってしまいますが、音声だからこそ気軽に話かけて使えるのかもしれませんね。
4. VUIのデメリットは?
音声を使うからこそのデメリットももちろんあります。
4-1. 操作を他の人に聞かれてしまう
外や壁の薄い家に住んでいる場合、VUIを使って操作しようとした音声が他の人の耳に届いてしまうことも少なくありません。
特に何か調べ物をする時などは外で声を出して検索するのは少し憚ることもあるでしょう。
電車の中など公共の場では使いづらいので、TPOに合わせて使っていく必要があります。
4-2. 精度が低いと聞き取ってもらえない
やはり人間の言葉を機械が完全に理解するというのは難しい部分もあり、話かけても間違った単語で認識されたりとVUI側でうまく内容をキャッチしてもらえない時は、何度も聞かれ直したりします。実際、私もたまに音声でメッセージ送信や検索を試みますが、あまり聞き取ってもらえないこともあり歯痒いです。
日々いろんな人が使うことでデータが溜まり、より改善していくと分かっていても、なかなか分かってもらえない時はイライラしてしまうものですね。
5. VUIを開発するにはどのような技術が必要なの?
VUIに使われている技術は、簡単にいうと大きく3つのフェーズに分けられます。
5-1. 音声認識
スマートスピーカーなどに対して話した言葉を認識する必要があります。どのような言語なのか、どのような声色でどんな音が発せられたのかを捉えます。
5-2. AIを使用した解析・分析ロジック
捉えた音声をAIで解析し、分析します。ユーザーがどんなことを聞いているのかをデータを元に分析して処理し、結果を返します。
5-3. テキスト変換
処理した結果をテキストにし、それをまた音声にして返します。こうして、ユーザーは結果を音声で聞くことができるのです。
AmazonのAlexaなどは開発のためのパッケージが提供されているので、興味のある方は触ってみると良いでしょう。
https://developer.amazon.com/en-US/alexa
VUIでは、人間の声・話という曖昧なものが相手になるので、よく言えば柔軟、違う言い方をすれば「それっぽいもの」を作ることになるそうです。
オフショア開発ではVUIをメインで扱っている会社は少ない印象ですが、webエンジニアの基礎があれば比較的開発はやりやすいと言われており、これからベトナムなどのオフショア開発でもVUIの開発をできる人は多くなっていくでしょう。
6. VUIのまとめ
どんどん私たちの生活に溶け込んでいるVUIですが、知れば知るほどそのメリットを感じます。
VUIデザインは開発時に欠かせないものとなっていく可能性が高いため、キャッチアップしていきましょう。
参考:
https://type.jp/et/feature/12303
https://dev.classmethod.jp/articles/history-and-future-of-vui/
7. VUIのPoCをしませんか?AI開発ならバイタリフィへ
また、対応する当社のAIチームは、AIコンペKaggleで2749チーム中10位!
Kaggle Masterの称号を持つAIエンジニアチームが、責任を持って対応致します!
まずは気軽に開発のご相談をいただければ幸いです!