speech, 

Sooftware Speech - AI & Speech Processing: Application-2

Sooftware Speech - AI & Speech Processing: Application-2

AI & Speech Processing: Application-2

본 글은 광운대학교 전자공학과 박호종 교수님의 강의를 듣고 작성되었음을 밝힙니다.

Speaker Verification and Identification

Verification (인증)

image

음성신호에서 개인별 고유 정보를 추출하여 본인 검증

Identification (인식)

image

여러 음성 신호에서 특정인 검색

  • Ex) Smartphone 지문 인식 문제

image

  • Why Bio 인증?

기존 비밀번호보다 편리?

기존 비밀번호보다 안전?

image

Voice를 이용한 보안의 문제점은 테러범의 핸드폰 같은 경우, 지문 혹은 얼굴 인식과 달리 본인이 마음 먹지 않으면 절대 풀 수가 없음.

Sound Recognition / Detection

  • 인간과 동일한 sound 정보 인식
Robot

아기 울음소리 / 동물소리 인식

자율주행 
:: 자율주행에서도 소리로 특징을 포착하는 기술이 필요 (구글은 사이렌 소리를 인식)

청각장애
  • 인간 능력 이상의 sound 정보 인식
불법 벌목 감청 (구글이 도입)

멸종위기 고래 탐지

Music Information Analysis

image

음악 검색, Hit 가능성 여부 예측, 인공 작곡 + 감정

  • Content 기반으로 Music 검색 / Retrieval
노래 일부분의 음만을 가지고 찾고싶은 노래 검색  

표절 확인

자동 노래 선곡 시스템

Speech and Audio Coding

전송 또는 저장을 위한 디지털 데이터양을 감소시키는 기술

=> 거의 완벽하게 산업화에 성공

디지털 이동 통신, portable music의 핵심

image

  • 현재의 연구 동향

모든 종류의 sound를 통합적으로 처리
(기존에는 speech codec, audio codec으로 구분)

  • 국제 기관 (ITU, ISO 등)에서 표준 codec 선정

3D Audio / 입체 음향

image

  • Audio for Virtual Reality

image

디지털 오디오 방송

객체(Object) 기반 디지털 오디오 방송

image

  • 오디오 객체별로 신호 전송

  • 사용자가 sound를 임의로 선택하여 청취

    • Sports 중계 방송, 음악 방송, 드라마
    • 언어 선택 (외국어로 방송 청취)
    • 입체 음향 청취

사용자는 원하는 오디오를 선택하여 청취

잡음 제거

image

잡음을 제거하는 간단한 방법으로 마이크를 여러개 설치한다.

Active Noise Cancellation (ANC)
=> Airpod Pro에 탑재된 기술 (주변 소음 제거)

image

들어오는 소리의 파형과 반대되는 파형을 더해줌으로써 0으로 만들어줌

기타

신호 복원 : 왜곡되고 변형된 신호를 원 신호로 복원

Sound type 분리

Multimedia DB에서 Audio 특성으로 원하는 장면 검색

의료 신호처리

음악 치료

음향 장비

Subscribe to SOOFTWARE

Get the latest posts delivered right to your inbox