アウトソーシングから、クラウドソーシングへ。CROWDビジネスで注文すれば1000万人が貴社の社員に。

CROWDビジネス

パッケージメニュー

CROWDビジネスパッケージ音声データ収集『CROWD音声コーパス』

クラウドソーシングで収集したコーパス読み上げの音声データ(商用利用可)を提供します。
※44kHz、クロスバリデーション済み、音声認識技術の機械学習に適したデータ、2次販売不可
※別途、オーダーメイドの音声データの製作/収集も承ります

音声データ収集の重要性

音声情報処理技術の向上には、大量の多様な訓練用音声データを集めることが極めて重要となっております。

 

従来では、音声データを集めるためにナレーション室を借り、アルバイト等の雇用によって必要な音声に応じた人数を確保して、音声データの収集をするのが一般的でした。

 

しかしクラウドソーシングの登場により、費用や手間を抑えて必要な音声データを集めることが可能となります。

音声情報処理技術の種類

音声情報処理技術といっても、様々な技術がありますが、特に下記の3つ技術についてはクラウドソーシングとの相性が良いと言われています。

  • 通常の人間の音声を文字に起こす「音声認識技術」
  • 音声から感情を読み取る「感情認識技術」
  • 拍手や笑い声といった音を区別する「環境音認識技術」

 

音声認識技術は、コミュニケーションロボットやIoTの発展により、様々な製品に組み込まれて、人間の生活の中で使用されることが増えている技術です。

 

生活環境内で使用されるため、クリアで聞き取りやすい音声だけでなく、多少の雑音を含む音声を訓練用の音声データとすることが音声認識技術の向上には欠かせません。

 

また、PCのマイクで集音するだけでなく、一般的に使用されるスマートフォン端末における集音することも、実際の生活環境内での音声認識のために重要な集音方法になります。

 

感情認識技術や環境音認識技術についても、製品への組み込みは進んでおり、音声データの量に応じて認識精度は比例的に向上することが様々な研究により実証されています。

 

そのためそのような大量の訓練用データを集めることも、音声情報処理技術の向上には不可欠なものであるといえます。

日本における音声コーパス収集の課題

日本における提供または販売されている音声コーパスはデータ量が十分でなく、音声処理技術の研究開発には大量のデータが必要になります。

 

また、目的にあった音声データを学習させないことには、精度の向上は望めません。

 

独自で収集しようにも、収集にかかる費用や手間を考えると大きな負担となってしまい、なかなか収集に踏み出せないのが現状ではないでしょうか。

CROWD音声コーパスの特徴

『CROWD音声コーパス』では、お客さまのニーズに応じた音声データを収集しております。

 

『CROWD音声コーパス』を活用すれば、大量かつ多様なデータを迅速に収集可能です。

 

音声データには、正解となる音声のテキストデータはもちろん、クロスバリデーションによる品質保証、発話者の属性情報などのアノテーションも同時に納品可能です。

 

数十万件以上といった大量の、数千人以上と言った多様な音声データを集めるのに、この『CROWD音声コーパス』をご検討してみるのはいかがでしょうか。まずは、お気軽にお問い合わせいただけますと幸いです。

 

sounds2

PAGE TOP