음성 인식이란 무엇입니까?

입력 방법으로 사용자의 음성 사용

음성 인식은 음성 입력을 시스템에 허용하는 기술입니다. 당신은 당신의 컴퓨터, 전화 또는 장치와 이야기하고 입력으로 말한 것을 사용하여 어떤 행동을 시작합니다. 이 기술은 입력, 클릭 또는 다른 방법으로 선택하는 것과 같은 다른 입력 방법을 대체하는 데 사용됩니다. 장치 및 소프트웨어를보다 사용자 친화적으로 만들고 생산성을 높이는 수단입니다.

군대, 장애인 (장애인 또는 손이나 손가락이없는 사람을 상상해보십시오), 의료 분야, 로봇 공학 등의 도움을 위해 음성 인식이 사용되는 분야와 응용 분야가 많이 있습니다. 가까운 장래에, 거의 모든 사람들이 컴퓨터 및 휴대 전화와 같은 공통 장치로 전파되므로 음성 인식에 노출됩니다.

특정 스마트 폰은 음성 인식을 흥미롭게 사용합니다. iPhone 및 Android 기기가 그러한 예입니다. 그들을 통해서, 당신은 'Call office'와 같은 말한 지시를받는 것만으로 연락 전화를 시작할 수 있습니다. 'Bluetooth 켜기'와 같은 다른 명령도 사용할 수 있습니다.

음성 인식 문제

Speech to Text (STT)라고 알려진 버전의 음성 ​​인식은 오랫동안 말을 텍스트로 번역하는 데에도 사용되었습니다. 비아 보이스 (ViaVoice)가 그 상자에서 말했듯이, "당신이 말하면, 그것은 타이핑합니다". 그러나 우리가 알고있는 STT에는 한 가지 문제가 있습니다. 10 년 전, ViaVoice를 사용해 보았는데 컴퓨터에서 일주일도 지나지 않았습니다. 왜? 그것은 대단히 정확하지 않았고 모든 것을 타이핑하는 것보다 더 많은 시간과 에너지를 말하고 수정하는 데 소비했습니다. ViaVoice는 업계 최고 중 하나이므로 나머지는 상상해보십시오. 이 기술은 성숙되고 개선되었지만 텍스트에 대한 연설로 사람들은 여전히 ​​질문을하게됩니다. 가장 큰 어려움 중 하나는 단어를 발음하는 사람들 사이의 엄청난 차이입니다.

모든 언어가 음성 인식에 사용되는 것은 아니며 영어는 지원되지 않습니다. 결과적으로 음성 인식 소프트웨어를 실행하는 대부분의 장치는 영어로만 합리적으로 작동합니다.

하드웨어 요구 사항에 따라 특정 경우에 음성 인식이 어려워집니다. 배경 소음을 필터링 할 수있을만큼 지능적이지만 동시에 자연스럽게 음성을 캡처 할만큼 강력한 마이크가 필요합니다.

배경 소음에 대해 말하자면 전체 시스템이 실패 할 수 있습니다. 결과적으로, 음성 인식은 많은 경우 사용자의 제어 밖에있는 잡음으로 인해 실패합니다.

음성 인식은 대량 텍스트 입력을위한 생산성 도구보다 VoIP와 같은 새로운 전화 및 통신 기술의 입력 방법으로 더 나은 것으로 입증되었습니다.

음성 인식 응용

이 기술은 많은 분야에서 인기를 얻고 있으며 다음과 같은 성공을 거두었습니다.

- 장치 제어. Android 휴대 전화에 "OK Google"이라고 말하면 음성 명령에 귀 기울이는 시스템이 작동합니다.

- 차량용 블루투스 시스템. 많은 차량에는 블루투스를 통해 스마트 폰과 라디오 메커니즘을 연결하는 시스템이 장착되어 있습니다. 스마트 폰을 건드리지 않고 전화를 걸고받을 수 있으며, 단지 말함으로써 전화를 걸 수 있습니다.

- 음성 녹음. 사람들이 많이 타이핑해야하는 분야에서, 일부 지능형 소프트웨어는 말로 표현 된 단어를 캡처하여 텍스트로 변환합니다. 현재 특정 워드 프로세싱 소프트웨어에 있습니다. 음성 녹음은 시각적 음성 메일 에서도 작동합니다.