aboutsummaryrefslogtreecommitdiffhomepage
path: root/src/content
diff options
context:
space:
mode:
Diffstat (limited to 'src/content')
-rw-r--r--src/content/docs/whisper-to-ai-moji-okoshi.mdx31
1 files changed, 15 insertions, 16 deletions
diff --git a/src/content/docs/whisper-to-ai-moji-okoshi.mdx b/src/content/docs/whisper-to-ai-moji-okoshi.mdx
index dc12d52..df51fc0 100644
--- a/src/content/docs/whisper-to-ai-moji-okoshi.mdx
+++ b/src/content/docs/whisper-to-ai-moji-okoshi.mdx
@@ -69,14 +69,16 @@ Whisper には tiny から large まで複数のモデルサイズがありま
<img src="/img/whisper-login.png" alt="Colab ログイン画面" class="whisper-img" />
-**③ メニューバーの「ファイル」→「ドライブにコピーを保存」を押します。**
-これで自分の Google Drive に Colab ノートブックがコピーされます。
+:::tip
+##### 💡 自分の Drive に保存したい場合
+メニューバーの「ファイル」→「ドライブにコピーを保存」を押すと、自分の Google Drive にノートブックが保存されます。保存しなくてもそのまま実行できます。実行中の編集が共有元に反映されることはありません。
+:::
-**④ メニューバーの「ランタイム」→「ランタイムのタイプを変更」を押します。**
+**③ メニューバーの「ランタイム」→「ランタイムのタイプを変更」を押します。**
<img src="/img/whisper-runtime.png" alt="ランタイム変更メニュー" class="whisper-img" />
-**⑤ ハードウェアアクセラレータを「T4 GPU」に設定し、保存ボタンを押します。**
+**④ ハードウェアアクセラレータを「T4 GPU」に設定し、保存ボタンを押します。**
<img src="/img/whisper-gpu.png" alt="GPU設定画面" class="whisper-img" />
@@ -85,7 +87,7 @@ Whisper には tiny から large まで複数のモデルサイズがありま
「v5e-1 TPU」などの選択肢もありますが、Whisper は PyTorch 製のため GPU(CUDA)でのみ高速動作します。TPU を選んでもエラーになるか、CPU 動作で非常に遅くなります。必ず **T4 GPU** を選択してください。
:::
-**⑥ 文字起こししたい音声ファイルを Google Drive の「マイドライブ」直下にアップロードします。**
+**⑤ 文字起こししたい音声ファイルを Google Drive の「マイドライブ」直下にアップロードします。**
ここでは例として `onsei.mp3` で説明します。mp3、m4a、wav などの音声ファイルだけでなく、mp4 などの動画ファイルもそのまま文字起こし可能です。
<img src="/img/whisper-mydrive.png" alt="マイドライブにアップロード" class="whisper-img" />
@@ -104,33 +106,30 @@ Whisper には tiny から large まで複数のモデルサイズがありま
##### 💡 「マイドライブ」直下とは?
Google Drive を開いたときに最初に表示される場所です。「会議録」などのフォルダの中ではなく、**フォルダの外**に置いてください。
-どうしてもフォルダに整理したい場合は、たとえば「会議録」フォルダに入れた場合、後ほど⑦で、パスの部分を `MyDrive/会議録/onsei.mp3` のように変えてください。
+どうしてもフォルダに整理したい場合は、たとえば「会議録」フォルダに入れた場合、後ほど⑥で書き換えるパスが `MyDrive/会議録/onsei.mp3` のように変わります。
:::
-**⑦ コード内のファイルパスを確認します。**
+**⑥ コード内のファイルパスを確認します。**
デフォルトでは `/content/drive/MyDrive/onsei.mp3` になっています。
- **マイドライブ直下**に置いた場合: ファイル名だけ書き換えればOK(例: `MyDrive/kaigi.mp4`)
- **フォルダに入れた**場合: フォルダ名を含めて書き換え(例: `MyDrive/会議録/onsei.mp3`)
-**⑧ 三角形の実行ボタン(▶)を押します。**
+**⑦ 三角形の実行ボタン(▶)を押します。**
<img src="/img/whisper-run.png" alt="実行ボタン" class="whisper-img" />
-**⑨ 警告が出たら「このまま実行」を押します。**
+**⑧ 警告が出たら「このまま実行」を押します。**
<img src="/img/whisper-konomama.png" alt="このまま実行" class="whisper-img" />
-**⑩ 完了すると、最後にすべてを連結した文章が表示されます。**
+**⑨ 完了すると、最後にすべてを連結した文章が表示されます。**
<img src="/img/whisper-finished.png" alt="文字起こし完了" class="whisper-img" />
-:::tip
-##### 💡 コピー方法に注意
-表示された文字起こし結果は `Ctrl+C` ではコピーされません。**マウスで結果を選択し、右クリック →「選択した内容をコピーする」** を選んでください。
+表示された文字起こし結果は `Ctrl+C` ではコピーできません。**マウスで結果を選択し、右クリック →「選択した内容をコピーする」** を選んでください。
<img src="/img/whisper-copy.png" alt="選択してコピー" class="whisper-img" />
-:::
コピーしたテキストを Word などに貼り付けてご利用ください。
@@ -140,7 +139,7 @@ Google Drive を開いたときに最初に表示される場所です。「会
<img src="/img/whisper-restart.png" alt="再実行ボタン" class="whisper-img" />
-うまく行かない場合は、メニューバーから「ランタイム」→「ランタイムを再実行」を押し、上記④⑤の手順で GPU に設定し直してから再実行してください。
+うまく行かない場合は、メニューバーから「ランタイム」→「ランタイムを再実行」を押し、上記③④の手順で GPU に設定し直してから再実行してください。
:::caution
##### ⏱ 制限時間に注意
@@ -167,7 +166,7 @@ Google Colab 無償版には利用制限があり、最長12時間(実質4〜5
### 具体的なプロンプト例
-上記⑩でコピーしたテキストを、以下のようなプロンプトとともに生成AIに渡します。
+上記⑨でコピーしたテキストを、以下のようなプロンプトとともに生成AIに渡します。
<div class="whisper-quote">