aboutsummaryrefslogtreecommitdiffhomepage
path: root/src/content/docs/whisper-moji-okosi.mdx
diff options
context:
space:
mode:
authorYasutake Yohei <61961825+yasutakeyohei@users.noreply.github.com>2026-06-25 11:05:59 +0900
committerYasutake Yohei <61961825+yasutakeyohei@users.noreply.github.com>2026-06-25 11:05:59 +0900
commit95e2fabff4f344acc933d3fe0cb7e9495ee03fe3 (patch)
tree81b288512adeb2b8f9b5c3273b2b49b74f18e39a /src/content/docs/whisper-moji-okosi.mdx
parent8680d5181a656a26485c3ae8ec7ad8372c04adab (diff)
Whisperページ: 文字起こし例の誤認識箇所に黄色マークを復元
Diffstat (limited to 'src/content/docs/whisper-moji-okosi.mdx')
-rw-r--r--src/content/docs/whisper-moji-okosi.mdx6
1 files changed, 4 insertions, 2 deletions
diff --git a/src/content/docs/whisper-moji-okosi.mdx b/src/content/docs/whisper-moji-okosi.mdx
index 7aefe13..34d09a9 100644
--- a/src/content/docs/whisper-moji-okosi.mdx
+++ b/src/content/docs/whisper-moji-okosi.mdx
@@ -22,9 +22,11 @@ description: OpenAI Whisperと生成AIを組み合わせた超高精度な文字
Whisperの単語誤り率(Word Error Rate; WER)は日本語で約6.4%とされています。「ほぼ完ぺき」と言われる5%に近く、実際の使用感でも非常に高い精度です。さらに **ファインチューン**(用途に合わせて人名や用語を追加学習させること)を行えば、100%に近い精度も期待できます。
-たとえば、直近(令和4年9月時点)の小平市議会定例会における私の質問と答弁の音声をWhisperで文字起こしすると次のようになります(間違えている箇所は黄色でマーク)。
+たとえば、直近(令和4年9月時点)の小平市議会定例会における私の質問と答弁の音声をWhisperで文字起こしすると次のようになります(間違えている箇所は<mark>黄色でマーク</mark>)。
-> いじめの重大事態に関してですよ、専門家から重大事態としてこれを扱いなさいと扱った方がいいですよという助言を受けながらですね、教育委員会としては重大事態として扱わなかったという事例があるんですが、一般して最終的に重大事態として扱うことになったんですが、その専門家から助言を受けたことで重大事態として扱ったわけではなくて、別の理由で扱うことになった。その専門家から重大事態として扱いなさいというような助言を受けたにも関わらず、その重大事態として扱わなかった場面において教育長はどのような指示されてきたのか…
+<blockquote>
+いじめの重大事態に関してですよ、専門家から重大事態としてこれを扱いなさいと扱った方がいいですよという助言を受けながらですね、教育委員会としては重大事態として扱わなかったという事例があるんですが、<mark>一般して</mark>最終的に重大事態として扱うことになったんですが、その専門家から助言を受けたことで重大事態として扱ったわけではなくて、別の理由で扱うことになった。その専門家から重大事態として扱いなさいというような助言を受けたにも関わらず、その重大事態として扱わなかった場面において教育長はどのような指示されてきたのか…
+</blockquote>
このように、個人名以外はほぼ完ぺきに文字起こしできています。役職名や市で独自に使っている単語などをファインチューンで最適化すれば、さらに精度が上がるでしょう。