はじめに:「Notta」とは?
Nottaは、ZoomやGoogle MeetなどのWeb会議をリアルタイムで文字起こしし、録音ファイルのアップロードにも対応するクラウド型のAI議事録ツールです。日本のNotta株式会社が運営しています。
58言語以上に対応し、多言語翻訳や要約機能も搭載されているため、グローバルなチームや海外とのやり取りが日常的に発生するビジネス環境において非常に役立ちます。
リアルタイムでの音声認識とテキスト化、さらに議事録の自動要約まで一貫してサポートする点で、議事録作成の手間と時間を大幅に削減できるのが魅力です。Webアプリ・スマホアプリ・Chrome拡張などマルチデバイス対応もされており、利便性の面でも優れています。

Nottaの主な特徴
Nottaの主な特徴は下記です。
- Zoom/Google Meetとの自動連携によるリアルタイム録音・文字起こし
- 録音ファイルのアップロード文字起こしにも対応
- 58言語以上の音声認識、42言語対応の翻訳機能
- AIによる要約・議事録生成
- 話者識別とタイムスタンプ付きの出力
- スマホアプリ、Webアプリ、Chrome拡張に対応
- PDF、Word、SRT形式でのエクスポート可能
💰 料金プラン
プラン名 | 月額換算 | 月間文字起こし時間 | 1回あたりの最大時間 | ファイルインポート | AI要約回数 | 特徴 |
フリープラン | ¥0 | 120分 | 3分 | 50件 | 10回 | 試用用。話者識別、会議自動転記対応 (notta.ai) |
プレミアム(Pro) | ¥1,185(月額) | 1,800分 | 90分 | 100件 | 100回 | ダウンロード・翻訳・単語登録あり |
ビジネス(Business) | ¥2,508(月額) | 無制限 | 5時間 | 200件/人 | 200回/人 | 録画、セキュリティ、レポート、CRM連携など対応 |
エンタープライズ(Enterprise) | 要相談 | カスタマイズ | 5時間 | 無制限 | 無制限 | SAML/SSO、AIトレーニング停止、監査ログ、専用サポートなど |
Nottaを実際に使ってみた
実際にNottaでアカウントを作成し、音声ファイルをアップロードして文字起こし機能を試してみました。
アカウント作成・初期設定
Googleアカウントで簡単にアカウント作成できますた、アカウント作成時に、使用目的や職業・職種など聞かれます。スキップもできるので、スキップを選択します。


プレミアムプランへの誘導がポップアップで表示されますが、プレミアムプランは今回使用しないので、ポップアップ右上の×ボタンを押して閉じます。

音声ファイルをアップロードして翻訳
管理画面に移動しますので、今回はアップロードボタンを押して、録音された音声からの文字起こしを行います。無料プランの場合は毎月120分まで使用可能です。

今回は試しに長めの25分弱の音声ファイルをアップロードしてみます。
話者識別をオプションで選択できます。今回は2人なので2を選択します。


25分弱の音声ファイルで2分弱で文字起こし完了
30秒程度で音声ファイルのアップロードが終了し、その後、文字起こしが開始されました。

文字起こしは2分弱で完了しました。
実際の文字起こし結果を確認してみると…
こちらが実際に文字起こしされたテキストです。
左側に要約が表示され、また画面下部では音声ファイルを再生できます。
肝心の文字起こし結果を見てみると、「まぁ」「あのまぁ」「えっと」などのフィラーワードもそのまま文字起こしされています。あと、「上の先生が来るので」の部分は「上野先生来るので」と表記されています。完璧なシステムはないですが、文字起こし精度は100%ではないです。

あと、文字起こし結果は無料プランだと3分までしか見られないです。下図のように3分以上の文字起こし結果部分はぼかされています。
無料利用では継続的な運用が実質難しく、プレミアムプランに加入せざるを得ません。

Nottaの改善点とデメリット
フィラーワードまで文字起こしされてしまう。ケバ取り機能がない
- 音声の質にもよるとは思うが、文字起こしの精度はまだ手直しが必要なレベルで、相槌や「えー」「えっと」「あの」「はい」といったフィラーワードまで文字起こしされてしまうので、都度手動で消さなければならないのが面倒
文字認識の精度は完璧ではない
- 単語登録しても聞き取れなかった単語の文字起こしは支離滅裂なことが多いため発音などにも注意して話されなければいけない
- 接続しているそれぞれ1名ずつの会議ではある程度の精度は保つが、1か所の会議室に複数名いて、リモート参加者もいるような会議では、文字起こしの精度が落ちてしまう。
長時間の音声ファイルの文字起こしだと数分かかる
- 1時間程度の長い音声ファイルの場合、文字起こしまでに4分以上かかることが多いため、文字起こしが完了するまで待たなければならないです。
デメリットを補う「インタビューAI」の活用提案
Nottaはスピードと多言語対応に強みがある一方で、次のような限界があります
- フィラー語や冗長な表現が残る
- 発言の意図や関係性を反映した自然な文構造にならない
- 長時間の文字起こしだと、音声ファイルアップロードと文字起こしに時間がかかkる
これらを補えるのが「インタビューAI」です。
インタビューAIを使うと、録音音声を15秒で文字起こしし、さらに文字起こし結果を自動で自然な会話形式に修正してくれます。音声ファイルをアップロードするだけで、文字起こしと自然な会話形式への自動修正ができます。
ちなみに、先ほどNottaに文字起こししてもらった25分弱の音声ファイルをインタビューAIでも文字起こし試してもらいました。
結果がこちらです。音声ファイルのアップロードは5秒程度、文字起こしはわずか12秒でした。文字起こし結果をNottaと比較してみると、文字起こしの時点で「あの」「まぁ」といったフィラーワードは取り除かれているのがわかります。
「上の先生」に関しては「上野先生」と間違えてしまっているのは同様です。さらに修正後のインタビューで、AIで自然なインタビュー形式になるように自動で修正されていますね。

無料プランでは30分まで文字起こし結果も全て表示されます。
インタビューAIはこちらから体験できますので、ぜひ体験してみてください。
まとめ:Nottaを使いつつ、課題はインタビューAIで補完
Nottaは、録音と文字起こしを軸とした会議記録ツールとして非常に優秀です。ただし、「長時間の音声ファイルの高速文字起こし」「自然な日本語の議事録」「読ませるインタビュー記事」のような文章整形を含む高品質な出力には限界があります。
この弱点を補う選択肢として、インタビューAIの導入を併用することで、会議後の資料作成・編集作業が大幅に効率化されます。
録音→文字起こし→編集→記事化までワンストップで行いたい方は、NottaやインタビューAIの併用をぜひ検討してみてください。。