S�ntese de Voz - Revista .Net Magazine 96

De que se trata o artigo

O artigo trata do PaaS e seus conceitos e, como pode atingir uma empresa, mostrando como uma equipe de TI pode se preparar para sua utilizaç�o e quais cuidados uma empresa deve tomar antes de utilizar o PaaS.

Em que situaç�o o tema � �til

Quando se deseja entender e at� mesmo aplicar o modelo de neg�cio proposto pelo PaaS. Desta forma, ser� poss�vel mostrar os reais ben�ficos para os departamentos de TI, por exemplo,

PaaS e SaaS � Entenda sobre o Saas e Paas

A ideia � apresentar o SaaS a partir da perspectiva do consumidor corporativo: como os departamentos de TI podem se beneficiar da adiç�o de aplicativos SaaS ao seu portf�lio de serviços? Quais s�o as implicaç�es da adiç�o de aplicativos hospedados externamente ao ambiente computacional da empresa? O que ser� preciso fazer para se preparar para o SaaS? Assim, neste artigo iremos abordar todos esses pontos e examinar alguns casos especiais que podem fazer sentido para o seu departamento e at� lev�-lo a se tornar um provedor de SaaS, como um consumidor.

Dentro dos conceitos da intelig�ncia artificial existe uma �rea denominada de processamento de voz, que foi desenvolvida com intuito de permitir ao usu�rio interagir com o computador atrav�s da fala. O processamento de voz aplicasse em algumas �reas, entre elas, a que abordaremos neste artigo, a s�ntese de voz. Vamos abordar a forma mais usada e conhecida que � representada pela sigla TTS (Text-To-Speech) que em portugu�s significa �Texto para Fala� e, basicamente, � o processo de convers�o de um texto em ondas sonoras que possam ser compreendidas por n�s humanos.

Desde o surgimento das tecnologias de processamento de voz, sua utilizaç�o n�o era muito comum, devido a alguns fatores como dificuldade de implementaç�o, alto custo e baixa confiabilidade. Hoje temos uma realidade totalmente diferente que tornou-se poss�vel graças ao avanço no desenvolvimento de computadores com maior poder de processamento, mais velozes, novas abordagens e tecnologias na �rea de desenvolvimento de sistemas. Fatores como esse foram indispens�veis na criaç�o das tecnologias que temos hoje como: smartphones, tablets, computaç�o nas nuvens, sistemas complexos de reconhecimento facial, reconhecimento de voz, s�ntese de voz, entre outros.

Com isso, surge tamb�m a necessidade de soluç�es em software cada vez mais sofisticadas e que venham facilitar a vida dos usu�rios, cito como exemplo um dispositivos muito conhecido e utilizado hoje, o GPS (Global Position System), a maioria desses aparelhos utiliza a fala para nos guiar, possibilitando que o motorista desprenda atenç�o total ao transito enquanto o sistema passa as coordenas por meio da fala.

Voc� deve estar se perguntando, mas como isso � poss�vel, h� uma maneira de fazer o computador falar? Sim! E a resposta para essa pergunta est� baseada nos conceitos de S�ntese de voz, no exemplo do GPS, em sua grande maioria, esses aparelhos utilizam a tecnologia de s�ntese de voz para transformar as coordenadas obtidas pelo sat�lite em uma linguagem conhecida por n�s como fala.

No decorrer desse artigo apresentarei as tecnologias de processamento de voz desenvolvidas pela Microsoft e tamb�m vamos colocar em pr�tica esses conceitos e desenvolver uma aplicaç�o utilizando os recursos dessa plataforma por meio da plataforma .NET e tamb�m utilizando a linguagem de programaç�o C#.

Voz x Fala

No decorrer da introduç�o voc� deve ter se deparado com essas duas palavras: Voz e Fala, por�m qual � a relaç�o ou distinç�o entre elas, veremos a seguir.

A voz humana � a principal ferramenta de comunicaç�o e � resultado de um completo processo, cujo mecanismo envolve o sistema nervoso central, o sistema fonador e o sistema respirat�rio. N�o podemos deixar de considerar que mesmo que estejamos efetuando a produç�o de voz por meio de um sistema computacional, a mesma foi gravada por um humano, o computador tem apenas a funç�o de utilizar os conceitos da s�ntese de voz para reproduzi-la, seja por processo de concatenaç�o, formantes ou qualquer outro existente. J� a fala � um conjunto de sons articulados, que tamb�m � essencial no processo de comunicaç�o e est� diretamente ligada a voz.

Microsoft Speech Platform SDK

� uma plataforma baseada em processamento de voz desenvolvida pela Microsoft e permite utilizar funç�es de reconhecimento e s�ntese de voz. Esse SDK passou a compor o .NET Framework a partir da vers�o 3.0 e foi resultado de anos de pesquisa e aperfeiçoamento. Possui um sintetizador que tem seu funcionamento baseado em um banco de dados de segmentos sonoros criados a partir de horas e horas de discursos gravados. A efic�cia do �back end� depende de qu�o boa � a seleç�o dos segmentos sonoros apropriados para a entrada informada e execut�-los suavemente.

As principais funç�es que est�o dispon�veis para trabalhar com processamento de voz s�o: " [...] continue lendo...

S�ntese de Voz - Revista .Net Magazine 96

Nesse artigo abordaremos o desenvolvimento de uma solução baseada em síntese de voz em português utilizando a linguagem de programação C#. Também será demostrado como utilizar a Microsoft Speech Platform SDK.

Artigos relacionados