Mozillaの「Common Voice」–音声認識改善のためのクラウドソースデータベース


私はスコットランドの深いアクセントについて多くの賛辞を受け取りますが、SiriやAlexaなどの音声アプリに関しては、私の声は資産というよりも負債です。 AppleとAmazonが音声アシスタントを作成していたとき、彼らはスピードダイヤルに関するスコットランド語のアクセントコンサルタントを持っていなかったようです。

音声認識が将来の方法であると想定されている場合私たちが向かっている場所–検索エンジンと音声アシスタントは、難しいアクセントを理解するより良い仕事を始める必要があります。全員に英語のパブリックボーイアクセントはありません。

Mozilla(Firefoxブラウザーのメーカー)は、人々に「共通の声 」と呼ばれるデータベースに声を出してくれるよう依頼することで、問題の解決を試みています。音声を一致させてフレーズを設定することで、Mozillaは、データベースが最終的に音声認識に依存するアプリにとって将来的に非常に貴重なツールになることを望んでいます。 >さらに先に進む前に、プライバシーの問題を最初に邪魔にならないようにしましょう。すでにそれらが入ってくるのが聞こえるので。

Firefoxアカウント、Githubアカウント、またはGoogleアカウントを使用してサインアップすることは可能ですが、代わりにメールでサインアップすることもできます。匿名の使い捨てメールアカウントを開くと、誰もあなたが話すほど賢くはありません。

一度アカウントを作成してログインすると、ダッシュボードを見る になります。

2つのセクションがあります– 話すおよび聞く。 [話す]セクションでは、自分の声を投稿するよう求められます。 聞くでは、他の人の声を聞いて、彼らが話さなければならなかったフレーズと比較します。その後、それが正しいかどうかを示します。

話す

発言セクションに参加するには、声をはっきりと拾う機能するマイクが必要です。また、Mozillaサイトにそのマイクへのアクセスを許可する必要があります。

[話す]セクションをクリックすると、5つのランダムなフレーズのセットが表示されます。指示は画面上に非常に明確でわかりやすく説明されています。

下のマイクアイコンをクリックして、通常の声調で文章を読みます。不自然なアクセントをつけたり、ゆっくりと話したりしないでください。

演習の全体的なポイントは、データベースが人々のアクセントを通常の話し方で理解することを学習することです。別の方法で話すと、全体が無意味になります。

最初のフレーズが完了すると、右上隅に、クリップを再生し、次の場合にクリップを再録音するオプションが表示されます。あなたはそれに満足していません。

満足している場合は移動します次のフレーズに進み、5つのフレーズがすべて完了するまで続けます。次に、青色の[送信]ボタンをクリックして、チェックのためにクリップをMozillaに送信します。

ダッシュボードに に戻ると、これらのフレーズがクレジットされていることがわかります。

それは、すすぎと繰り返しの単純なケースです。 Mozillaがデータベースで得られる貢献とアクセントが多ければ多いほど、プロジェクトは成功します。

聞く

Mozillaにフレーズを投稿したら、チェックする必要があります。音声クリップがフレーズと一致することを確認します。これはボランティアにもクラウドソーシングされています。

ダッシュボード上 に戻ると、右側にListenセクションが表示されます。 トップレベルユーザーセクションから、いくつかの深刻な統計情報が収集されていることがわかります。

音声フレーズの検証を開始するには、その 聴く に移動します セクション するとフレーズと再生ボタンが表示されます。

再生ボタンをクリックして(スピーカーがオンになっていることを確認してください!)、録音された音声が聞こえます。フレーズが正しく話されていると判断した場合は、[はい]をクリックします。発音の誤り、何か他の言葉、またはその他のエラーがあった場合は、[いいえ]をクリックします。

結論

これは、Mozillaが現在行っている多くのプロジェクトのうちの1つにすぎません(MozillaのメインWebサイト をクリックし、上部の[プロジェクト]をクリックします。常に変更されます)。クラウドソーシングは価値のあるプロジェクトを実現するための優れた方法であり、将来に役立つ何かを構築するために時間を寄付する価値があります。

Cât de mare este Alphabet ???

関連記事:


5.08.2019