openaiのwhisperの使い方
概要
- openaiが公開しているOSSのspeech-to-textモデル
- medium以上のウェイトは高精度
インストール
$ pip install whisper
使い方
# モデルのロード
model = whisper.load_model("medium") # 'base'はモデルのサイズです。'tiny', 'small', 'medium', 'large' から選べます。
# 音声ファイルの変換
result = model.transcribe("your.mp3")
# 結果の表示
print(result["text"])