ビジネス誌「月刊BOSS」。記事やインタビューなど厳選してお届けします! 運営会社 月刊BOSSについて

経営者インタビュー

「月刊BOSS」と、日本最大級のビジネスマッチングポータルサイト「WizBiz」との提携に伴い、 17万社を超えるWizBiz会員の中から伸び盛りの企業を毎月1社をピックアップ。トップの事業への情熱に迫る。

2018年7月号より

【BOSS×WizBiz】“声で書く”“声で動かす” グーグルに勝る音声認識技術 鈴木清幸 アドバンスト・メディア会長兼社長
鈴木清幸 アドバンスト・メディア会長兼社長

鈴木清幸 アドバンスト・メディア会長兼社長

すずき・きよゆき 1952年生まれ。京都大学大学院工学研究科化学工学専攻博士課程中退。86年インテリジェントテクノロジー入社。97年アドバンスト・メディアを設立し、社長に就任。2005年マザーズに上場。10年会長兼社長に就任。

いま音声認識分野のテクノロジーに対する注目が高まっている。人間とAIが会話するコミュニケーション分野や、働き方改革の効率化のためのテキスト化、機械翻訳やビッグデータまで、幅広い分野で活用されてきている。需要の高まりとともに国内シェアナンバーワンの音声認識技術「AmiVoice」を持つアドバンスト・メディアが上場来初の営業黒字決算を迎えた。アドバンスト・メディア会長兼社長の鈴木清幸氏に話を聞いた。

上場来初の営業黒字

―― 2018年3月期は05年の上場来初の営業黒字決算になりました。1997年12月の設立以来20年、どのように成長してきたのでしょうか。
企業としては利益を求めることが目的です。私は利益を求めるだけでなく、継続することが本来の使命だと思っています。利益は結局、売り上げとコストの引き算ですが、この2つの不確定な要因をどうコントロールするか。売り上げとコストの差がプラスであり続けるには、まず売り上げのほうで継続的に伸びていくものを作らなくてはいけません。

しかし、アドバンスト・メディアという集団が本来の目的を果たすには、まだまだ人が成長しないといけません。もともとが大企業の出身者などが集まって始まった会社ですから、成長ビジネスを新しく作るという観点でみれば未熟集団でした。成長ビジネスの作り方をいろいろ試してきて、仮説を設けながら20年やってきましたが、最初の10年は特に試行錯誤を続けてきました。当時は世界最高の技術があれば市場ができると思ってやってきました。ところが、世界最高の技術はできても、市場はできなかったのです。

―― 技術はあっても何が足りなかったのでしょうか。
我々は「エンジン」という言葉を使っていますが、音声認識エンジンは世界最高です。しかし、自動車に例えると、クルマの完成品は購入しても、エンジンだけにお金を払うことはありません。最高の技術ならではのサービスやソフトウェアに仕立てないと始まらないわけです。もちろん世界最高の技術がなければ、市場を作ることすらできません。技術は必要条件ですが、それだけでは難しい。経営や市場作りは、難しい目的関数の最適化問題ということになります。

もっとも重要なのは、我々が出す音声認識は、世の中の人は見たことがないものだということです。見せれば多くの人が拍手をしてくれます。でもそこに落とし穴があって、拍手はしてくれても使ってくれない。音声認識に対して見たことがないものだから使う文化がない。特に日本人は、一緒に人がいなければしゃべりません。音声認識を使って書くには、しゃべることが当たり前にならないと、利用するという行為にまで行き着かないわけです。

こうすればユーザーが増えるだろうという仮説と検証を繰り返し、事業部というプレイヤーの集団が結果を出せるように目標を作って、それを後押しするのがリーダーです。そのリーダーたちを指導ができるように指導するのが経営になります。まずはいまのままでは達成できないような目標を作り、1年間という時間を使っていかに達成するかチャレンジしていく。通期で見れば四半期ごとに4つのチャンスがありますから、実績ができれば目標値をうまく変えながら成長させていく。

―― 上場企業の場合は、達成できそうにない通期見通しでは非難されてしまいますね。
そうですね。達成できる目標を開示しなさいという。これこそ日本を成長させない国にしています。私は常に売り上げが上がるように誘導してきましたし、損もどんどん減損してきましたので、このやり方でいい。実は4年前に、黒字になりかかったのですが、もっと成長度を上げなくてはいけないと、従来の4つの事業体に6つの事業体を付け加え、10の事業体にしました。

―― あえて新規事業の投資を増やしたと。
もともとの4つの事業体では増収増益で黒字化していました。加えた6つというものは、海外事業や家電制御など、売り上げのレバレッジを1段階高めるためのものです。現在は第1の成長エンジンとしての5つの事業部(BSR1=CTI事業〔コールセンター向け〕/医療事業/VoXT事業〔書き起こし〕/クラウド事業〔翻訳、音声入力〕/SEC事業〔AI対話〕)とM&Aした子会社を含む第2の成長エンジンである5つの事業(BSR2=ビジネス開発センター/海外事業/AmiVoice THAI/グラモ〔家電制御、センサー〕/速記センターつくば)として取り組んでいます。BSR1は増収増益、BSR2についても計画を上回る増収・営業損失の縮小を実現でき、当初の目標よりも高い姿になっています。

世界最高の技術力

―― 近年、スマホをはじめ急速に音声認識を使ったサービスが広がっているように思います。
我々のサービスは2つ。1つは声で書く。もう1つは声で動かすです。声で機械に対して訴えるやり方は極めて自然で、人間にとって負担がありません。ですから我々はそこを極めることに取り組んできました。たとえばコールセンターでは、声のなかに含まれる情報を機械が感知してガイドしていきます。文字起こしをした情報から意味を掴み、AIがアクションする。お客様とのしゃべりの品質が上がりますし、効率も上がるので、対応する時間も短くなり、お客様も満足します。

―― 音声認識技術と相俟って、AIやIoTといった新しい技術の進化も大きいですね。
私自身、第2次人工知能ブームの時にAIの世界に入りました。その後の2000年にかけて暗黒の時代を経て、ディープニューラルネットワークが発見され、画像認識で非常にいい成果が上がりました。音声認識でも成果が出たことによって、大ブレイクしたのがいまのAIです。

大きく2つ、AI音声認識と音声AIがあります。前者が我々の音声認識技術「AmiVoice」で、後者が、我々が新たなビジネスにしている「AmiAgent」の音声対話のAIや、AIスピーカーみたいなものがそれです。我々が20年の革新を経て成長させてきたAI音声認識は、精度面で飛躍的に成長し、その安定性も向上しました。それから自己進化できる面でも向上しました。我々はさらにそこにLSTM、短期記憶メモリーの装備によって、過去の記憶をうまく利用して精度を上げていくことに成功しています。

音声認識は音響処理と言語処理の2つの処理を同時にやりますが、音響処理についてはディープニューラルネットワークが極めて有効です。自己進化をしながら、使えば使うほど、精度が上がっていく。ところが、言語処理については、言葉は文化と言われるように、簡単に精度を上げることができません。しかし我々はB2Bの世界で長年データを蓄積してきて、どのようにすれば精度が上がるのか、ノウハウを掴んでいます。この点がグーグルをはじめGAFA(グーグル、アップル、フェイスブック、アマゾン)にはないものです。彼らはコンシューマーからデータを得ていますが、B2Bで使えるデータは持っていません。我々がグーグルはじめGAFAに負けない世界最高の音声認識技術を持つ理由です。

―― 特に日本語は英語圏の人には難しい表現が多いです。
彼らにできないのは、日本語の機微を認識することです。「関係をたつ」と言った時には、「たつ」には「断」と「絶」の2種類があり、正しく文字が当てはめられません。しかもこの言葉は、その時の気持ちによって使い方が変わるため、絶対にやめる時は「絶」、一時的に関係を断るには「断」を使います。ビジネスで音声認識を使う場合は、この精度がなければいちいち直さなければならず、効率的ではありません。

―― 音声AI分野についてはどうでしょう。
音声処理を前提とした人工知能になりますが、我々の技術は、大手銀行のアプリに採用されているバーチャルアシスタントや、不動産の物件探しの自動対応に利用されています。

07年にスティーブ・ジョブズがiPhoneを発表して、機械とのコミュニケーションがキーボードからタッチに変わりました。この延長線上に声があります。象徴的なものがアマゾンのエコーやグーグルホームのAIスピーカーです。

我々のBSR2にあたるグラモという会社がありますが、ここの事業は家電制御とセンサーです。部屋の中をモニタリングして、快適にするというビジョンで動いています。たとえば「電気消して」とか「テレビつけて」と話すと、電気やテレビのスイッチをON・OFFしてくれる。従来は複数のリモコンで操作していたものを音声認識で操作できるようになっています。電力量が見える化されたり、エアコンの操作を自動的に覚えたりと、話せば環境を設定してくれるわけです。

―― 海外事業についてはどのように進んでいますか。
実はタイのほうが、日本よりも音声認識を使ったサービスが進んでいます。先ほど言葉は文化だという話をしましたが、日本で差別化要素を訓練したことで、異言語でも使える部分が多くあります。米国の音声認識の世界的な企業であるニュアンス社がタイの通信会社TRUEグループと組んでいたのですが、我々がニュアンス社に勝ってTRUEグループと提携し、ジョイントベンチャーを設立しました。

日本市場は我々がGAFAに勝って覇権を持ちます。アジア圏はGAFAでなく中国企業が強いのですが、タイで勝てる実績があるように、アジア圏でも覇権を獲りたいと思っています。

(聞き手=本誌編集長・児玉智浩)

セゾンプラチナ・ビジネス・アメリカン・エキスプレス・カード

大正フリーローン

ビズネクスト

 

0円(無料)でビジネスマッチングができる!|WizBiz

WizBizセミナー/イベント情報

名刺の価格革命

田町・品川の貸し会議室|WizBizの会議室情報

名刺などのデータ入力代行サービス|WizBiz

経営者占い