素材管理
音声認識機能を使用するには、音声認識リソースと関連データを準備する必要があります。このセクションでは、音声認識リソースと関連データの管理方法について説明します。
SDKが音声を認識するには、音声ソースアセットリソースを準備する必要があります。 音声ソースアセットリソースをSORI Consoleにアップロードすると、ファイルが解析され、認識モデルに再編成されます(これをaudiopack
と呼びます)。そのため、元の音声ソースアセットに復元することはできません。
認識モデルは、認識に必要な情報を含むデータ構造です。SDKが初期化されると、デバイスに自動的にダウンロードされます。 audiopackのファイルサイズは、元の音声ソースアセットと比較してかなり小さくなります(audiopackのサイズは元の音声ソースアセットの約1/100です)。
素材リスト
素材リストには、登録された素材のリストが表示されます。リストには、素材名
、ステータス
、タグ
、作成日
を表すアイテムが含まれています。
各行の先頭には、素材のステータスを示すステータスアイコンがあります。ステータスアイコンは以下のいずれかになります:
ステータス | 説明 |
---|---|
素材は準備完了で、認識可能です。 | |
ソースファイルのアップロードと処理が進行中です。 | |
素材の処理中にエラーが発生しました(例:ファイル形式またはサイズを確認してください)。 | |
素材は認識に使用できません(例:運用期間が終了しています)。 |
タグと名前で素材を検索できます。
素材の作成
[素材](https://console.soriapi.com/resource/material/)を作成するには、ページ右下の+をクリックします。以下の情報をフォームに入力してください。
動画ファイル:認識ソースとなる動画ファイルをドラッグ&ドロップするか、ボックスをクリックして追加します。
INFO
- 動画に複数の音声トラックがある場合、最初の音声トラックが認識されます。
- 動画の音声が単純な家庭の騒音、低音量のささやき声などで構成されている場合、音声認識がうまく機能しない可能性があります。
名前:認識ソースの名前。検索時に使用されます。
運用期間:認識ソースの運用期間。この期間外では認識されません。
タグ:Enterキーを押して個別のタグを書き込みます。検索時に使用されます。
メモ:素材に関する追加情報を入力できます。検索には使用されません。
認識可能なメディア(素材)の最小長は10秒で、少なくとも15秒以上の認識ソースを使用することをお勧めします。
素材の編集
編集する素材の行をクリックします。
- 名前:鉛筆ボタンを押して名前を編集できます。チェックボタンをクリックして保存します。
- ビデオ/オーディオ:認識ソースとなる動画ファイルを置き換えます。既存の認識ソースは削除され、認識されなくなります。
それ以上の変更がない場合は、変更を保存をクリックして保存します。
素材の削除
- 削除する素材の行をクリックします。
- 右上の素材を削除をクリックします。
- 確認をクリックします。
認識ソースを削除すると、関連するすべてのレポートデータが削除されます。