Otter –実際に動作するAI駆動の音声転写サービス


過去10年間がモバイルのすべて だったように、インターネットの次の10年間は​​オーディオについて になります。 音声検索 からディクテーションからAIアシスタント に至るまで、キーボードは最終的に音声に置き換えられます。手首にとっては朗報です。

ディクテーションとトランスクリプションの音声認識は、依然として非常にヒットとミスです。業界のリーダーはドラゴン であり、GoogleとAppleはどちらもGoogleドキュメントマックOS に組み込まれた優れたディクテーション機能を備えています。しかし、全体として、特に異常なアクセントがある場合は、音声認識が正しくない場合があります。

そのため、カワウソ は波を起こしています。これは実際に機能する音声転写サービスであり、非常にうまく機能します。さらに良いことに、最高のオファーがすべてプロプランの背後にあるわけではありません。

オッターとは

1人以上の音声ファイルがある場合話している場合、それらの会話の書面バージョンが必要な場合があります。 YouTube字幕用 にしたいのか、SEOの目的でオンラインにアップロードしたいのでしょうか?それとも、講義の音声録音を使用している学生で、書かれたバージョンが必要ですか?

どのような状況でも、音声転写サービスを使用する理由はたくさんあります。しかし、これまで人工知能のオプションは悪名​​が高く、あなたに代わってそれをやろうと申し出た企業はわいせつな金額を請求していました。

しかし、今ではOtterが手頃な価格で誰でも利用できるようにしています。これは、オンラインの人工知能を搭載したマシンであり、オーディオファイルを取得して、書かれたバージョンをすぐに吐き出します。正確な時間の長さは、明らかにオーディオファイルの長さに依存します。

始める前に…..Otterについて心に留めておくべきこと

Otterオーディオトランスクリプションサービスは、完全に完璧になるとは限りません。

  1. 人々が途切れ、文の途中で方向を変えるからです。聴いているとき、これはそれほど悪くないように聞こえます。しかし、書面で見ると混chaとしているように見えます。
  2. 人がすぐに話し、ある文が別の文にぶつかると、カワウソは句読点で問題を起こすことがあります。その後、完全なストップが見逃される可能性があります。
  3. 特定のアクセントがある場合、Otterは少し誤解する可能性があります。したがって、Proプランのカスタムボキャブラリーリストの利点があります。
  4. 一部の単語のスペルが間違っています。たとえば、会社のLyftのスペルが「Lift」である可能性があります。
  5. Otter Audio Transcription Serviceへのサインアップ

    無料プランでは、毎月600分の無料の文字起こしが可能です。カジュアルなユーザーにとっては、これで十分です。ただし、Proプラン(月額9.99ドルまたは年額99.99ドル)へのアップグレードを選択した場合、そのメリットは驚くべきものです。

    これらの600分は月に最大6,000分を撮影し、トランスクリプションをさまざまなファイル形式(PDFやDOCXなど)、カスタムボキャブラリリスト(トランスクリプションの精度を向上させるため)、Dropboxの同期などにエクスポートします

    ただし、音声文字起こしサービスのテストでは、600分が必要以上に長くなります。 Otterウェブサイト にアクセスしてサインアップします。アカウントを作成するか、GoogleアカウントまたはFacebookアカウントを使用してサインアップできます。

    次に、アカウント設定で、アカウントをGoogleまたはMicrosoftに接続して、カレンダーと連絡先を取り込むことができます。 ズーム の統合は素晴らしいタッチです。ズームコールを行うと、音声がすぐにOtterに送信されて転記されます。

    カワウソで最初の転写を行う方法

    この記事では、ダウンロードしたポッドキャストのMP3ファイルを使用します。ただし、Otter Webサイトに直接話している人を録音することもできます。そうすると、そのように転写されます。

    • メインダッシュボードページに移動し、オーディオ/ビデオをインポートをクリックします
      • アップロードウィンドウが表示され、コンピューター上のファイルの場所に移動したり、マウスやトラックパッドでドラッグアンドドロップしたりできます。ファイルが存在すると、アップロードが開始されます。
        • 成功ステータスが表示されたら、[完了]をクリックすると、「処理中」と表示されます。
          • 今では待っている問題。この1時間のファイルでは、音声文字起こしに30分かかりました。文字起こしの準備ができたら、常に電子メール通知を受け取ります。そのため、オーディオファイルをアップロードし、プロセスを開始してから、すべてをシャットダウンして、立ち去ることができます。 Otterは完了したら通知します。
          • 完成したトランスクリプト

            • トランスクリプトの準備ができたことが通知されたら、サイトに戻って、ダッシュボードページでクリックします。これで、便利なキーワードとタグが表示されます。他の人が共有リンクを作成して表示することもできます。
              • 私が言ったように、完璧ではないので、すぐにエラーが表示されます。しかし、これらは青い[編集]ボタンをクリックして簡単に修正できます。
                • 次にOtter Webサイトのタイプミスを修正し、すべてを保存することを忘れないでください。
                  • 次は、ファイルをエクスポートします。 3つの縦のドットをクリックして、[テキストをエクスポート]を選択します。
                    • 無料版のみが提供しますテキストファイルバージョンまたはクリップボードにコピーする 、およびその他のさまざまなオプションは、本当に必要な場合を除き、変更しないでください。
                    • Otterの優れている点は、速度と、AIが十分にインテリジェントであるという事実です。オーディオの異なるスピーカー。重要なのは些細なことです。

                      関連記事:


                      4.01.2020