오늘 NeurIPS(신경 정보 처리 시스템에 관한 연례 회의)에서 음성 언어 데이터 세트에 대한 두 개의 인텔 지원 백서가 발표되었습니다. 첫 번째 논문인 The People's Speech 는 "자동 음성 인식" 작업을 대상으로 합니다. 두 번째는 "키워드 스포팅"을 포함하는 MSWC( Multilingual Spoken Words Corpus )입니다. 각 프로젝트에서 나오는 데이터 세트는 상당한 양의 풍부한 오디오 데이터를 제공하며 각 데이터 세트는 동급에서 사용 가능한 가장 큰 컬렉션 중 하나입니다.
MSWC 논문은 인텔 SATG(Software and Advanced Technology Group)의 AI 프레임워크 엔지니어인 Keith Achorn이 공동 저술했습니다. Keith 는 인텔 커뮤니티 사이트의 블로그에서 프로젝트에 대한 자신의 경험에 대해 이야기 합니다 .
People's Speech 및 MSWC 프로젝트는 ML Commons 의 후원으로 2018년에 시작되어 전 세계에서 가장 많이 사용되는 50개 언어를 식별하고 단일 데이터 세트로 차트화한 다음 데이터를 유용하게 만드는 방법을 찾습니다. Intel, Harvard, Alibaba, Oracle, Landing AI, University of Michigan, Google, Baidu 등의 그룹 구성원이 있습니다.
오늘날과 같이 다양한 국제, 다국어 작업 환경에서 정확하게 전사하고 번역하는 능력은 점점 더 중요해지고 있습니다. 이러한 데이터 세트를 통해 인공 지능을 사용하는 컴퓨터는 말을 "듣고" 자동 대본 또는 번역을 생성할 수 있습니다.
두 프로젝트 모두 "다양한 음성"을 사용합니다. 즉, 서로 다른 음향 환경의 녹음 장비를 혼합하여 배경 소음과 비공식 음성 패턴을 갖춘 자연 환경을 더 잘 나타냅니다. 이것은 오디오북과 같이 더 "살균"된 고도로 통제된 콘텐츠와 구별됩니다. 다양한 언어에 대한 훈련은 실제 사용에서 더 나은 정확도와 상관관계가 있습니다.
People's Speech 프로젝트에는 수만 시간의 감독된 대화 오디오가 포함되어 있습니다. 이것은 이제 학문적 및 상업적 사용이 허가된 세계 최대의 영어 음성 인식 데이터 세트 중 하나이며 무료로 다운로드할 수 있습니다.
MSWC는 수십 개 언어로 된 300,000개 이상의 키워드가 있는 오디오 음성 데이터 세트이며 스마트 장치에서 액세스할 수 있습니다. MSWC는 50억 명이 넘는 사람들이 사용하는 언어를 포괄하는 데이터 세트이며 전 세계의 광범위한 청중을 위한 음성 응용 프로그램의 연구 및 개발을 발전시킵니다.
두 데이터 세트 모두 사용자가 널리 사용할 수 있습니다. 상업적 사용을 포함하여 매우 관대한 라이선스 조건으로 라이선스가 부여됩니다.
'브랜드관 > 인텔' 카테고리의 다른 글
Mobileye, 1억 개의 EyeQ 칩 출하 기념 (1) | 2021.12.24 |
---|---|
인텔의 혁신, 2025년을 넘어 무어의 법칙 추진 (0) | 2021.12.24 |
인텔, 통합 포토닉스 연구 센터 출범 (0) | 2021.12.24 |
메타버스에 전원 공급 (0) | 2021.12.24 |
인텔, Mobileye 공개 계획 발표 (0) | 2021.12.24 |
Inspur, Ruijie, Silicom, 인텔 IPU 생태계 확장 (0) | 2021.12.24 |
CES 2022에서 Intel, Mobileye (0) | 2021.12.24 |
AWS re:Invent 2021의 Intel (0) | 2021.12.24 |