背景デザイン画像1 背景デザイン画像2

Portfolio

Image&Speech to Text を作成してみた

MENU

 概要

画像ファイルと音声ファイルから文字起こしをするアプリを作成しました。



無料枠を使用しているため以下の制限があります。
  • 画像ファイルはjpgファイルのみ対応

  • 音声ファイルはwavファイルのみ対応

  • 容量200MBとなっているが無料枠なので実際は20M程度

  • データサイズが無料枠を超過している場合はエラーメッセージを表示

  • 容量が大きいサイズは無料枠を超えないサイズまで分割して使用することになる

スマホから使用することも多いため不要な処理を極力排除してレスポンス時間が短くなるようにしています。

使用方法

Speech to Text の場合

1. 「変換方法の選択」で「Speeech to Text」を選択

2.  waveファイルをアップロード

3. 「テキストに変換」を押す


音声ファイル
声の広報かすがい 4月15日号(NO.698)

Image to Text の場合

1. 「変換方法の選択」で「Image to Text」を選択
2. jpgファイルをアップロード
3. 「テキストに変換」を押す



画像ファイル



元資料
新型コロナウイルス感染症の予防