aboutsummaryrefslogtreecommitdiffhomepage
path: root/src/content/docs
diff options
context:
space:
mode:
Diffstat (limited to 'src/content/docs')
-rw-r--r--src/content/docs/whisper-moji-okosi.mdx57
1 files changed, 56 insertions, 1 deletions
diff --git a/src/content/docs/whisper-moji-okosi.mdx b/src/content/docs/whisper-moji-okosi.mdx
index a9f275e..4812f2d 100644
--- a/src/content/docs/whisper-moji-okosi.mdx
+++ b/src/content/docs/whisper-moji-okosi.mdx
@@ -7,7 +7,7 @@ description: OpenAIのWhisperを使った超高精度な文字起こしの方法
会議のたびに会議録を残すようにしています。以前は(承諾を得て)録音したものを家に帰ってから文字起こししていましたが、骨の折れる作業でした。自動化しようと色々なソフトを試しましたが、雑音があったり話者がマイクから遠い場合にはうまく認識してくれず、結局はその場でPCにタイプするのが最も効率的でした。
-そんな中、2022年9月にOpenAIから **Whisper** という文字起こしAIが公開され、試してみたところ驚くべき性能でした。それ以来、議会の一般質問や各種会議の文字起こしに活用しています。
+そんな中、令和4年9月にOpenAIから **Whisper** という文字起こしAIが公開され、試してみたところ驚くべき性能でした。それ以来、議会の一般質問や各種会議の文字起こしに活用しています。
## 雇用を奪わない形でのAI活用
@@ -23,6 +23,61 @@ Whisperの単語誤り率(Word Error Rate; WER)は日本語で約6.4%とさ
このように、個人名以外はほぼ完ぺきに文字起こしできています。役職名や市で独自に使っている単語などをファインチューンで最適化すれば、さらに精度が上がるでしょう。
+## Whisperで文字起こし → 生成AIで仕上げる
+
+Whisperだけでも十分実用的ですが、文字起こし結果を **生成AI(ChatGPT, Claude, Gemini など)に渡す**ことで、さらに高品質な会議録ができあがります。
+
+### 生成AIにできること
+
+1. **誤字・脱字の修正**
+ Whisperの聞き間違い(例: 「一般して」→「一旦は」)を文脈から推測して修正してくれます。
+
+2. **話者の特定とラベル付け**
+ あらかじめ話者の情報(「市長=小林洋子」「質問者=安竹洋平」など)を伝えておけば、発言ごとに `【安竹】` `【市長】` のように話者ラベルを付けてくれます。
+
+3. **フィラーの除去と文章整形**
+ 「えー」「あのー」といったフィラー(つなぎ言葉)を除去し、読みやすい文章に整形します。
+
+4. **要約の生成**
+ 長い会議の要点を箇条書きでまとめることもできます。
+
+### 具体的なプロンプト例
+
+Whisperで文字起こししたテキストをコピーし、以下のようなプロンプトとともに生成AIに渡します。
+
+> 以下は市議会の一般質問の文字起こしです。次のように整形してください:
+>
+> - 誤字・脱字を文脈から判断して修正する
+> - 話者を特定し、発言の先頭に【話者名】を付ける
+> 話者: 安竹洋平(質問者)、小林洋子(市長)、教育長(名前不明)
+> - 「えー」「あのー」などのフィラーは削除する
+> - 文意が通るように適宜句読点を補う
+> - 元の発言内容は変えないこと
+>
+> [ここにWhisperの文字起こし結果を貼り付ける]
+
+### 実例
+
+**Whisper出力(生):**
+> いじめの重大事態に関してですよ専門家から重大事態としてこれを扱いなさいと扱った方がいいですよという助言を受けながらですね教育委員会としては重大事態として扱わなかったという事例があるんですが一般して最終的に重大事態として扱うことになったんですが
+
+**生成AIで整形後:**
+> 【安竹】いじめの重大事態に関してです。専門家から「重大事態として扱った方がいい」という助言を受けながら、教育委員会としては重大事態として扱わなかった事例があります。一旦は最終的に重大事態として扱うことになったのですが…
+
+### 議会での活用フロー
+
+```
+音声ファイル(.mp3/.m4a)
+ ↓ Whisper で文字起こし
+生テキスト(誤字・フィラーあり)
+ ↓ 生成AI で整形
+整形済みテキスト(話者ラベル・句読点付き)
+ ↓ 最終確認・加筆
+完成した会議録
+```
+
+この方法を組み合わせることで、2時間の会議の会議録作成が、従来の半分以下の時間で完了するようになりました。
+
## 使い方(Google Colab で簡単実行)
### Google Drive を使う方法(推奨)