バイブコーディング#音声認識#Whisper#Speech API
音声アプリの作り方
Web Speech APIやWhisperを使った音声認識アプリの作り方。文字起こし、音声コマンドなどを解説。
音声アプリの作り方
音声認識・合成を使ったアプリを作りましょう。
できること
- 音声→テキスト変換
- テキスト→音声変換
- 音声コマンド
- 文字起こし
技術選択
| 技術 | 用途 |
|---|---|
| Web Speech API | ブラウザ内蔵、無料 |
| Whisper | 高精度、多言語 |
| Google Speech | 商用向け |
Web Speech API(無料)
プロンプト:
ブラウザの音声認識で文字起こしアプリを作って:
- 録音ボタン
- リアルタイム文字起こし
- テキストをコピー可能
- 日本語対応
Whisper(高精度)
プロンプト:
OpenAI Whisperで音声文字起こし:
- 音声ファイルアップロード
- APIで変換
- 結果表示
- タイムスタンプ付き
コード例(Web Speech API)
const recognition = new webkitSpeechRecognition()
recognition.lang = 'ja-JP'
recognition.continuous = true
recognition.onresult = (event) => {
const text = event.results[event.results.length - 1][0].transcript
console.log(text)
}
recognition.start()
音声合成
プロンプト:
テキストを読み上げる機能を追加:
- テキスト入力
- 再生ボタン
- 速度調整
- 音声選択
活用例
- 議事録自動作成
- 音声メモアプリ
- 語学学習アプリ
- アクセシビリティ向上
次のステップ
参考文献・引用元
- [1]Web Speech API- Mozilla
- [2]OpenAI Whisper- OpenAI