【精度90%超え】自動議事録システム「JAPAN AI SPEECH」が、単語学習により大幅な精度向上を実現
業界用語・専門用語も高精度な文字起こしが可能に
JAPAN AI株式会社(本社:東京都新宿区、代表取締役社長:工藤 智昭、以下JAPAN AI)は、高精度かつ高速の文字起こしを話者を分離した状態で行える “JAPAN AI SPEECH” に対して、特定の単語を学習させることにより、文字起こしの精度を大幅に向上させることに成功しました。
背景・課題
議事録などの会話を記録する作業は、AIを活用した自動化による工数削減が期待されています。
しかし、特にビジネスシーンにおいては、特殊な業界用語を頻繁に使用するため、用語を正確に認識し、文字起こしすることが難しく、精度に大きな課題がありました。
【不動産業界の専門用語における誤った読み取り・文字起こしの例】
(正)尺貫法
(誤)釈観法
また、AIに単語を学習させることで読み取り・文字起こしの精度が向上することは以前から知られていますが、同時に、特定の単語を学習させると、それまで正確に読み取れていた単語の精度が低下するケースがあるという技術的な課題も存在します。
独自技術と個社対応により、高精度の文字起こしを実現
これらの課題に対して、JAPAN AIでは、個社ごとに学習させる単語を選定し、精度を向上させるチューニングを開始しました。
単語学習には、独自で見出した最適な学習法を用いており、大幅な精度向上を実現しています。(学習に必要な情報は基本的にテキストのみ。単語を読み上げた録音は不要)
以下は、不動産業界と金融業界の専門用語を盛り込んだ音声の文字起こしを、学習前と学習後で比較した結果になります。
金融業界の例
※用いたサンプル音声:https://youtu.be/G6CGg3XRgyE
金融業界は、購買力平価や債務対GDP比率といった数多くの専門用語が存在し、プレーンな文字起こしシステムでは正確な読み取りが難しいケースが多々あります。
今回用いた例文では、単語学習により、単語誤り率が13.8%→1.3%と大幅な精度向上が認められました。
不動産業界の例
※用いたサンプル音声:https://youtu.be/JUPGtGx9UPU
不動産業界もまた、専門用語が多く用いられる業界であり、坪など、他の単語と間違えてしまいかねない用語も多々存在します。
今回用いた例文では、単語学習により、単語誤り率が9.9%→3.7%と大幅な精度向上が認められました。
改善が認められなかった単語について
今回用いた例文においても、ボラティリティ指数、住宅用地、建ぺい率、住宅需要といった単語は改善が認められませんでした。
正しく読み取れない理由の一つに「話し方の癖」がありますが、話者の声音を学習データに用いることで、より高い精度を実現できる可能性があります。
業務上必要となる精度は、業界や企業によっても異なるため、JAPAN AIでは、企業ごとに求める要件に応じた単語学習を行なっています。
今後の取り組み
精度向上と並行して、様々な用途に対応する新機能の開発を行ってまいります。
JAPAN AI株式会社
【お問い合わせ先】
JAPAN AI株式会社
担当:飯田
TEL:03-5909-8181
MAIL:pr@japan-ai.co.jp
【JAPAN AIについて】
JAPAN AIは「企業が1社に一つオリジナルのAIを持つ時代を創る。AIは働く人をサポートし、圧倒的な生産性を実現する。」というビジョンを掲げ、最新のAI技術を活用したプロダクトやサービス提供により、多様な業界での事業拡大や産業の発展に貢献していきます。
【会社概要】
社 名:JAPAN AI株式会社
代 表 者:代表取締役社長 工藤 智昭
本 社:東京都新宿区西新宿6-8-1
設 立:2023年4月14日
資 本 金:4,000万円
事業内容:人工知能の研究開発、人工知能に関するコンサルティングサービス
U R L:https://japan-ai.co.jp/