クロネコびより: Subtitle 機能を shotcut で使う : [Subtitles] button in the latest Shotcut (ver 24.10.29)

土曜日, 11月 09, 2024

まえから気になってたが、
Shotcut 音声の字幕化にて紹介されてた。

これは、便利？？とおもって、あれこれ調べる。

whisper.cpp というエンジンを使うらしい

Fedora40 で使うには、どうしたもんか....

となったので、あれこれ格闘したメモ。

まず、

sudo dnf groupinstall 'Development Tools'
sudo dnf -y install gcc-c++

ユーザディレクトリ内に bin フォルダなどを適当につくって

cd
mkdir bin （あればスキップ）
cd bin
git clone https://github.com/ggerganov/whisper.cpp.git

.... "whisper.cpp" というフォルダができる

cd whisper.cpp

./models/download-ggml-model.sh multilingual-large

.... multilingual で Invalid と言われるので

以下の３つを実行

./models/download-ggml-model.sh medium
./models/download-ggml-model.sh large
./models/download-ggml-model.sh large-v2

ようやく whisper.cpp の make 処理

make

shotcut を立ち上げて、こないだ作ったずんだもんが歌ってる動画を使ってみる。

aiko カブトムシずんだもんカバー（アカペラ混声バージョン）

１．[Subtitles] ボタンを押す

２．[Speech to Text]

別ダイアログがでてくるので、以下の項目を追加。

[Maximum Line Length] を少し小さめに (20 とか）

[Whisper.cpp executable] main

/home/hoge/bin/whisper.cpp/main

[GGML Model] ggml-large-v2.bin

/home/hoge/bin/whisper.cpp/models/ggml-large-v2.bin

[Track with Speech] で、必要なトラックのみチェック

[OK] で処理開始

３．[Generate text on timeline]

タイムライン全体の[フィルタ]-[サイズ・位置・回転]で字幕の場所移動

....トラック全体で、字幕のフォントとか変えるのがめんどうだなぁ。。。

通常のタイムラインのなかに字幕をいれたから、 [出力] のトラックは消しても大丈夫そう。。
（mp4 変換時に、多少コーンバート時間早くなるか？）