yotiky Tech Blog

とあるエンジニアの備忘録

HoloLens2 の Azure 音声認識サービス チュートリアル

公式ページ。 docs.microsoft.com

目次

チュートリアル

基本的に用意されたものを組み上げて動作を確認する内容になってる。

作業を終えたらAzureのリソースは削除すること。

概要と目標

前提条件とか。(2020/5現在)

音声認識と文字起こしの統合と使用

  • Speech SDK を使用するため、競合しないようにMRTKの音声コマンドは[Manual Start]に変更する
    • Clone する Profile
      • DefaultHoloLens2InputSystemProfile
      • DefaultMixedRealitySpeechCommandsProfile
  • Azureのリージョンは、東日本ならjapaneast、西日本ならjapanwest
  • 認識するのは英語のみ

音声認識を使用したコマンドの実行

発音だけなんとかなれば。

Azure Cognitive Services の Speech Translation コンポーネントの追加

残念ながら日本語は選択肢にない。

意図と自然言語の理解の設定

LUISのAPIがv3.0でGAしており、チュートリアルで使うライブラリ(v2.0向け)と互換性が取れないため、 残念ながら最後まで行けず。

LUISの設定でEntity type に[Simple]はなかったので、[Machine learned]あたりかな?

docs.microsoft.com