【テレワーク寺子屋】音声の文字化を手軽に

レビュー&コラム

テレワークでよく使うテレカン。実際の取材もオンラインで行う事が増えています。ちょっとした打合せであれば「録画」データを共有すればいいのですが、取材や議事録などを残しておきたい場合はテキストにしておく必要があります。

そこで気になってくるのが、音声データをテキストに変換するサービス。これまで秋葉は「Amazon Transcribe」を愛用していました。

「Amazon Transcribe」を使うには、あらかじめ少し準備しておく必要があります(※1)が、ある程度の精度で文字起こしされたテキストを取得することができます。

※1 秋葉は、ZapierやAWS Lambdaなどと組み合わせ、ストレージにアップロードしたら自動的に文字起こしするという簡単なプログラムを自作して運用しています。

ただ、いくつか困った点も。すべての言葉を文字起こししてしまうため「えーっと」とか、「その〜」といった言葉も取得してしまう上、あまり精度が高くないということもあるため、もう一度音声を聞き直しながらテキストを修正する作業が必要となるのです。

もっと楽にテキスト化できるツールがないか探していたところ、アドバンスト・メディアの「AmiVoice Cloud Platform」というサービスを発見しました。

AmiVoice Cloud Platformを使うと、ビジネス用語などもきちんとテキストになってきます。また、医療用や製薬用、金融用などに特化した文字認識エンジンを使うことで、そういった分野の音声データも的確にテキスト化されます。

APIで提供されているサービスであるため、使うには若干のプログラミングなどが必要になりますが、そのあたりは個人の努力でなんとかなりそうです。

実際にAmiVoice Cloud Platformで文字起こしをしたところ、かなりの精度でテキスト化されるのを確認しました。これから、より使い勝手のいいようにいろいろと工夫していこうと思っています。

自分自で工夫するのが難しいという人は、AmiVoice Cloud Platformのエンジンを使ったサービスを使うという方法もあります。たとえば、VoXTの「ボクスト・セルフ」では専用アプリケーションが提供されているため、これを使えば手軽にテキスト化できます。

「文字起こし作業が必要だけど面倒くさい」という人は、音声認識APIを試してみてはいかがでしょうか。

[pt_view id=”c7cdfe7s9t”]

秋葉 けんた

秋葉 けんた

IT系のライティングを担当。 書籍、雑誌、業界誌やWebコンテンツなど、コンシューマからB2Bまで幅広く執筆。また、広告やカタログ、導入事例といった営業支援ツールの制作にも携わる。年間におよそ200件の原稿を執筆。●これまでの主な仕事 PC/周辺機器(CPU/DVD・BD・HD DVD/LCD/プリンタなど)、基幹システム(CRM/ERP/SFA/SOA/帳票など)、ストレージ(SAN/NAS/LTO/SASなど)、セキュリティ(BIOS/UTM/情報漏えい対策/デザスタリカバリ/内部統制・コンプライアンス/ネットワークセキュリティ/メールセキュリティなど)、ネットワーク(KVMスイッチ/グループウェア/サーバ/資産管理/シンクライアント/ホスティングなど)、その他(.NET/BI/カタログ/各種戦略/導入事例/パートナー取材など)…ほか、多数執筆。●連絡先 メール:kenta@office-mica.com

関連記事

コメント

この記事へのコメントはありません。

マイカのニュースレターに登録

* = required field
TOP

お問い合わせ

CLOSE

お問い合わせ