AI文字起こしツール「toruno(トルノ)」徹底解剖。25分の音声ファイルで文字起こし時間25分かかる?

はじめに:「toruno」とは?

toruno(トルノ)は、リコーが提供するオンライン会議やセミナーの記録・文字起こしに特化したクラウドサービスです。

会議まるごと記録サービス toruno | Ricoh
リコーが提供する「会議まるごと記録サービス」。会議やセミナーを「文字起こし+録音+画面キャプチャ」で記録。会議の振り返りや共有、議事録作成の下地にご利用ください。

「誰が、いつ、何を言ったか」を録音・文字起こし・画面キャプチャで正確に記録し、あとから簡単に検索・共有・編集できるのが特長です。

特にビジネス現場での議事録作成や情報共有の効率化に強みを持ち、個人から法人まで幅広く利用されています。

リアルタイム録音・文字起こしに加え、録音済み音声や動画ファイルのアップロードにも対応しており、議事録の質とスピードを同時に高めることが可能です。

toruno

torunoの主な特徴

torunoの主な特徴は下記です。

  • オンライン会議特化カンファレンス録音&文字起こし torunoは会議・セミナーを「文字起こし+録音+画面キャプチャ」で丸ごと記録するリコー提供サービス
  • リアルタイム&ファイルアップロード対応 リアルタイムで文字起こしできる専用デスクトップ(Windows)およびiPhoneアプリ対応。また、音声・動画ファイルもウェブ経由でアップロード可能
  • 高精度の会話分割/話者識別 話者ごとに文章が分かれ、発言単位での録音再生が可能。文字起こし精度も高く評価されている
  • 無料で試用可能 パーソナル向け:累計3時間/法人ビジネス向け:3週間で最大30時間の無料お試しあり

💰 toruno料金プラン(2025年7月時点)

パーソナル(個人向け)とビジネス(法人向け)で下記のように分かれています。

プランカテゴリプラン名月額基本料金含まれる利用時間従量課金単価保存容量登録ユーザー数
パーソナル無料0円累計3時間(登録後)20GB
パーソナル有料1,650円(税込)月10時間2.2円/分(税込)20GB
ビジネス月30時間9,000円(税抜)月30時間300円/時(税抜)75GB最大1,000人
ビジネス月100時間28,500円(税抜)月100時間285円/時(税抜)250GB最大1,000人
ビジネス月500時間135,000円(税抜)月500時間270円/時(税抜)1,500GB最大1,000人

torunoを実際に使ってみた

実際にtorunoでアカウントを作成し、音声ファイルをアップロードして文字起こし機能を試してみました。

アカウント作成・初期設定

こちらからメールアドレスとパスワードでアカウント作成できます。

toruno
メモどりやノートは、もうこのtorunoにお任せください。オンラインの会議やセミナーなどを自動で文字起こし。音声や表示された画面も記録。議事録作成や動画の文字起こしなどにもお使いいただけます。

確認コードがメールアドレスに送られるので、確認し入力します。

登録完了の画面が表示されるので、そのままログイン画面に進みます。

音声ファイルをアップロードして翻訳

ログインすると管理画面に移動しますので、今回はファイルをアップロードを押して、録音された音声からの文字起こしを行います。

試しに長めの25分弱の音声ファイルをアップロードしてみます。ファイルアップロードのポップアップで条件の記載がありますが、音声の場合は1ファイル1GB・3時間まで対応しているので、大丈夫そうです

話者識別の選択は、ないです。

25分弱の音声ファイルで、25分以上文字起こしにかかる..

Nottaの場合と同じく30秒程度で音声ファイルのアップロードが終了し、その後、文字起こしが開始されました。

文字起こしは結構時間がかかっていますね。17:36分から文字起こし開始したのですが、10分経過しても文字起こし中で、結果を確認できませんでした。。。

無料プランだから、文字起こしの優先度が低くなっているなどあるのでしょうか?

18:20ごろ完了予定と表示されたので、文字起こしまでに45分近くかかることになりますね。利用ユーザーが多いので並列処理に限界があり、キューに溜まっているとかですかね。それにしても結構長くかかってしまいます。。

実際の文字起こし結果を確認してみると…

実際には18:02に文字起こしが完了したので、26分文字起こしにかかったことになります。音声ファイルにカーソルを合わせると、文字の出現頻度に応じたタグクラウドが表示されているのが面白いですね。

肝心の文字起こしの結果はこのような感じでした。

報告というか、プレゼンするんですけれども

大体手術日は手術日でも外来の日でもあまり変わらず、大体6時ぐらいからか自分で改心して、7時から8時の間に上野先生来るので、

来たら自分でその患者さん1人1人プレゼントが報告して、一緒に回るとそそのまま手術に入るっていうリズムなので、あんまり日本ではそれはないですよね多分

研修医とか専攻医と指導医が一対一です。もうセットになって、入院中も外来も全部3ヶ月間はそのフィックス固定された組み合わせ

診療するとそれは結構アメリカでは一般的なんですけどもそれが完全に本当は違うシステムで知ったが非常に私にとってはやりやすくて1人ともう固定されてるので、連絡も取りやすいですし、

間部学ぶ方もその先生のやり方をみっちり学べるので、

いいシステムかなと思いました。

肝心の文字起こし結果を見てみると、nottaの時ほど「まぁ」「あのまぁ」「えっと」などのフィラーワードは文字起こしされていないです。

ただ、「上の先生が来るので」の部分は「上野先生来るので」と表記されています。回診も改心になっています。あとは「プレゼンというか報告して」は「プレゼントが報告して」となってしまっています。文字起こし精度は100%ではないです。nottaとあまり精度は変わらなさそうですね。

話者分離に関しては、文字起こしテキストの左のアイコンが1と2が表示されており、ある程度自動で話者分離されていそうです

torunoの改善点とデメリット

文字起こしにかかる時間が長い

  • Nottaの場合は25分の音声ファイルで2分弱で文字起こしされましたが、同じ音声ファイルでtorunoの場合には26分もかかりました。並行して別の作業をしていたり、文字起こしが急ぎでない場合には問題ないですが、急ぎの場合には、かなりボトルネックになりそうです。

文字認識の精度は完璧ではない

  • 文字起こしの精度は検証した音声ファイルの場合は、Nottaと同じくらいで、ミスが散見されました。

デメリットを補う「インタビューAI」の活用提案

torunoのデメリット・改善点を補えるのが「インタビューAI」です。

インタビューAIを使うと、1時間の長い音声ファイルの場合でもわずか15秒で文字起こしし、さらに文字起こし結果をAIが自動で自然な会話形式に修正してくれます。音声ファイルをアップロードするだけで、文字起こしと自然な会話形式への自動修正ができます。

interview-ai-top

まとめ:torunoを使いつつ、課題はインタビューAIで補完

torunoは、録音と文字起こしを軸とした会議記録ツールとして非常に優秀です。ただし、「長時間の音声ファイルの高速文字起こし」「自然な日本語の議事録」「読ませるインタビュー記事」のような文章整形を含む高品質な出力には限界があります。特に文字起こしまで数十分かかるのは難点ですね。

この弱点を補う選択肢として、インタビューAIの導入を併用することで、会議後の資料作成・編集作業が大幅に効率化されます。

録音→文字起こし→編集→記事化までワンストップで行いたい方は、torunoやインタビューAIの併用をぜひ検討してみてください。

Nottaの特徴や、実際に使ってみた結果、改善点などはこちらに詳しく記載してあります。

タイトルとURLをコピーしました