Skip to content

素材管理

音声認識機能を使用するには、音声認識リソースと関連データを準備する必要があります。このセクションでは、音声認識リソースと関連データの管理方法について説明します。

SDKが音声を認識するには、音声ソースアセットリソースを準備する必要があります。 音声ソースアセットリソースをSORI Consoleにアップロードすると、ファイルが解析され、認識モデルに再編成されます(これをaudiopackと呼びます)。そのため、元の音声ソースアセットに復元することはできません。

認識モデルは、認識に必要な情報を含むデータ構造です。SDKが初期化されると、デバイスに自動的にダウンロードされます。 audiopackのファイルサイズは、元の音声ソースアセットと比較してかなり小さくなります(audiopackのサイズは元の音声ソースアセットの約1/100です)。

素材リスト

Material list

素材リストには、登録された素材のリストが表示されます。リストには、素材名ステータスタグ作成日を表すアイテムが含まれています。

各行の先頭には、素材のステータスを示すステータスアイコンがあります。ステータスアイコンは以下のいずれかになります:

ステータス説明
素材は準備完了で、認識可能です。
ソースファイルのアップロードと処理が進行中です。
素材の処理中にエラーが発生しました(例:ファイル形式またはサイズを確認してください)。
素材は認識に使用できません(例:運用期間が終了しています)。

タグと名前で素材を検索できます。

素材の作成

[素材](https://console.soriapi.com/resource/material/)を作成するには、ページ右下の+をクリックします。

以下の情報をフォームに入力してください。

Adding new material

  • 動画ファイル:認識ソースとなる動画ファイルをドラッグ&ドロップするか、ボックスをクリックして追加します。

    INFO

    • 動画に複数の音声トラックがある場合、最初の音声トラックが認識されます。
    • 動画の音声が単純な家庭の騒音、低音量のささやき声などで構成されている場合、音声認識がうまく機能しない可能性があります。
  • 名前:認識ソースの名前。検索時に使用されます。

  • 運用期間:認識ソースの運用期間。この期間外では認識されません。

  • タグ:Enterキーを押して個別のタグを書き込みます。検索時に使用されます。

  • メモ:素材に関する追加情報を入力できます。検索には使用されません。

認識可能なメディア(素材)の最小長は10秒で、少なくとも15秒以上の認識ソースを使用することをお勧めします。

素材の編集

編集する素材の行をクリックします。

Material detail

  • 名前:鉛筆ボタンを押して名前を編集できます。チェックボタンをクリックして保存します。
  • ビデオ/オーディオ:認識ソースとなる動画ファイルを置き換えます。既存の認識ソースは削除され、認識されなくなります。

それ以上の変更がない場合は、変更を保存をクリックして保存します。

素材の削除

  1. 削除する素材の行をクリックします。
  2. 右上の素材を削除をクリックします。
  3. 確認をクリックします。

認識ソースを削除すると、関連するすべてのレポートデータが削除されます。