diff options
| author | Yasutake Yohei <61961825+yasutakeyohei@users.noreply.github.com> | 2026-06-25 12:51:11 +0900 |
|---|---|---|
| committer | Yasutake Yohei <61961825+yasutakeyohei@users.noreply.github.com> | 2026-06-25 12:51:11 +0900 |
| commit | 5e799af0ee98f0e9a46ca3f26eb498402e5ad5d4 (patch) | |
| tree | 131850e7728e8e424a1d84628a9228d590fc24a5 /src/content/docs/whisper-moji-okosi.mdx | |
| parent | 415f0e74df6d99686c2f4c388bbcbd9c0dc2c1e2 (diff) | |
Whisperページ: 構成を「手順→生成AI」の自然な流れに再編成
- Colab手順 → 生成AI仕上げ の順に並べ替え
- 「議会での活用フロー」→「活用フロー」に改名
- 「Colabで文字起こしする手順」→「ColabでWhisper文字起こしをする手順」
- プロンプト例の前に「上記⑩でコピーしたテキストを」とつなぎを追加
Diffstat (limited to 'src/content/docs/whisper-moji-okosi.mdx')
| -rw-r--r-- | src/content/docs/whisper-moji-okosi.mdx | 144 |
1 files changed, 73 insertions, 71 deletions
diff --git a/src/content/docs/whisper-moji-okosi.mdx b/src/content/docs/whisper-moji-okosi.mdx index 66913cc..ca900a3 100644 --- a/src/content/docs/whisper-moji-okosi.mdx +++ b/src/content/docs/whisper-moji-okosi.mdx @@ -44,78 +44,9 @@ Whisperの単語誤り率(Word Error Rate; WER)は日本語で約6.4%とさ <img src="/img/whisper-processing.png" alt="Whisperで文字起こし中の様子" class="whisper-img" /> -## Whisperで文字起こし → 生成AIで仕上げる +## ColabでWhisper文字起こしをする手順 -Whisperだけでも十分実用的ですが、文字起こし結果を **生成AI(ChatGPT, Grok, Claude, Gemini, DeepSeek など)に渡す**ことで、さらに高品質な会議録ができあがります。 - -### 生成AIにできること - -1. **誤字・脱字の修正** - Whisperの聞き間違い(例: 「一般して」→「一旦は」)を文脈から推測して修正してくれます。 - -2. **話者の特定とラベル付け** - あらかじめ話者の情報(「市長=小林洋子」「質問者=安竹洋平」など)を伝えておけば、発言ごとに `【安竹】` `【市長】` のように話者ラベルを付けてくれます。 - -3. **フィラーの除去と文章整形** - 「えー」「あのー」といったフィラー(つなぎ言葉)を除去し、読みやすい文章に整形します。 - -4. **要約の生成** - 長い会議の要点を箇条書きでまとめることもできます。 - -### 具体的なプロンプト例 - -Whisperで文字起こししたテキストをコピーし、以下のようなプロンプトとともに生成AIに渡します。 - -<div class="whisper-quote"> - -以下は市議会の一般質問の文字起こしです。次のように整形してください: - -- 誤字・脱字を文脈から判断して修正する -- 話者を特定し、発言の先頭に【話者名】を付ける - 話者: 安竹洋平(質問者)、小林洋子(市長)、教育長(名前不明) -- 「えー」「あのー」などのフィラーは削除する -- 文意が通るように適宜句読点を補う -- 元の発言内容は変えないこと - -[ここにWhisperの文字起こし結果を貼り付ける] - -</div> - -### 実例 - -**Whisper出力(生):** - -<div class="whisper-quote"> - -いじめの重大事態に関してですよ専門家から重大事態としてこれを扱いなさいと扱った方がいいですよという助言を受けながらですね教育委員会としては重大事態として扱わなかったという事例があるんですが一般して最終的に重大事態として扱うことになったんですが - -</div> - -**生成AIで整形後:** - -<div class="whisper-quote"> - -【安竹】いじめの重大事態に関してです。専門家から「重大事態として扱った方がいい」という助言を受けながら、教育委員会としては重大事態として扱わなかった事例があります。一旦は最終的に重大事態として扱うことになったのですが… - -</div> - -### 議会での活用フロー - -``` -音声/動画ファイル(.mp3/.m4a/.wav/.mp4 等) - ↓ Whisper で文字起こし -生テキスト(誤字・フィラーあり) - ↓ 生成AI で整形 -整形済みテキスト(話者ラベル・句読点付き) - ↓ 最終確認・加筆 -完成した会議録 -``` - -この方法を組み合わせることで、2時間の会議の会議録作成が、従来の半分以下の時間で完了するようになりました。 - -## Colabで文字起こしする手順 - -Google Drive に音声ファイルを置いて、Colab から直接読み込む方法です。インストール不要で、ファイルが大きくても高速に処理できます。 +ここからは実際の手順です。Google Drive に音声ファイルを置いて、Colab から直接読み込む方法で、インストール不要・無料で利用できます。 **① 以下のリンクを開きます。**(ブラウザは Google Chrome 推奨) @@ -196,6 +127,77 @@ Google Colab 無償版には利用制限があり、最長12時間(実質4〜5 - Google は情報を取得できる可能性があります。機密性の高い情報の場合は、ご自身の PC に Whisper をインストールしてご利用ください。 - ご利用に際して何らかの問題が生じた場合でも、私の方では責任を負えません。 +## 文字起こし結果を生成AIで仕上げる + +ここまでの手順で得られた文字起こし結果は、Whisper だけでも十分実用的です。しかし、このテキストを **生成AI(ChatGPT, Grok, Claude, Gemini, DeepSeek など)に渡す** ことで、さらに高品質な会議録に仕上げることができます。 + +### 生成AIにできること + +1. **誤字・脱字の修正** + Whisperの聞き間違い(例: 「一般して」→「一旦は」)を文脈から推測して修正してくれます。 + +2. **話者の特定とラベル付け** + あらかじめ話者の情報(「市長=小林洋子」「質問者=安竹洋平」など)を伝えておけば、発言ごとに `【安竹】` `【市長】` のように話者ラベルを付けてくれます。 + +3. **フィラーの除去と文章整形** + 「えー」「あのー」といったフィラー(つなぎ言葉)を除去し、読みやすい文章に整形します。 + +4. **要約の生成** + 長い会議の要点を箇条書きでまとめることもできます。 + +### 具体的なプロンプト例 + +上記⑩でコピーしたテキストを、以下のようなプロンプトとともに生成AIに渡します。 + +<div class="whisper-quote"> + +以下は市議会の一般質問の文字起こしです。次のように整形してください: + +- 誤字・脱字を文脈から判断して修正する +- 話者を特定し、発言の先頭に【話者名】を付ける + 話者: 安竹洋平(質問者)、小林洋子(市長)、教育長(名前不明) +- 「えー」「あのー」などのフィラーは削除する +- 文意が通るように適宜句読点を補う +- 元の発言内容は変えないこと + +[ここにWhisperの文字起こし結果を貼り付ける] + +</div> + +### 実例 + +**Whisper出力(生):** + +<div class="whisper-quote"> + +いじめの重大事態に関してですよ専門家から重大事態としてこれを扱いなさいと扱った方がいいですよという助言を受けながらですね教育委員会としては重大事態として扱わなかったという事例があるんですが一般して最終的に重大事態として扱うことになったんですが + +</div> + +**生成AIで整形後:** + +<div class="whisper-quote"> + +【安竹】いじめの重大事態に関してです。専門家から「重大事態として扱った方がいい」という助言を受けながら、教育委員会としては重大事態として扱わなかった事例があります。一旦は最終的に重大事態として扱うことになったのですが… + +</div> + +### 活用フロー + +ここまでをまとめると、次のような流れになります。 + +``` +音声/動画ファイル(.mp3/.m4a/.wav/.mp4 等) + ↓ Whisper で文字起こし(Colab) +生テキスト(誤字・フィラーあり) + ↓ 生成AI で整形 +整形済みテキスト(話者ラベル・句読点付き) + ↓ 最終確認・加筆 +完成した会議録 +``` + +この方法を組み合わせることで、2時間の会議の会議録作成が、従来の半分以下の時間で完了するようになりました。 + ## 制限時間を延ばしたい場合(Google Colab Pro) 処理の速度を上げたり制限時間を延ばしたい場合は、[Google Colab Pro](https://colab.research.google.com/signup) もしくは Pro+ を契約することで可能になります。 |
