Voices

HISTORIA DEL TRATAMIENTO DIGITAL DE LA VOZ

  • MÁQUINA PARLANTE

    MÁQUINA PARLANTE
    Aproximadamente por 1769, W.R. Kempelen, ingeniero y arquitecto húngaro, bien situado en el gobierno de su monarquía, ya había comenzado a trabajar en su máquina parlante (speaking machine). Se trataba de un dispositivo mucho más sofisticado, que era capaz de producir también sonidos consonánticos. Esta tarea le ocupó más de 20 años y sus resultados fueron publicados en un extenso volumen de 456 páginas, en 1791.
  • Máquina parlante de G. Wheatstone

    Máquina parlante de G. Wheatstone
    Esta máquina producía sonidos que eran comunes a todas las lenguas europeas. El inventor
    aseguraba que cualquier persona podía lograr en tres semanas realizar síntesis de voz,
    realmente sorprendente, en las lenguas francesa, italiana y latina. . Usando la descripción dada por Kempelen, C.
    Wheatstone, físico inglés nacido el 6 de febrero de 1802 en Gloucester y muerto el 19 de octubre
    de 1875 en París, construyó una versión mejorada de la máquina parlante.
  • SE ESCRIBE LA HISTORIA EN RECONOCIMIENTO DE VOZ

    SE ESCRIBE LA HISTORIA EN RECONOCIMIENTO DE VOZ
    Alexander Graham Bell quiso desarrollar un dispositivo capaz de proporcionar la palabra visible para la gente que no escuchara. Bell no tuvo éxito creando este dispositivo, sin embargo, el esfuerzo de esta investigación condujo al desarrollo del teléfono
  • DESARROLLO DEL TELÉFONO

    DESARROLLO DEL TELÉFONO
    Alexander Graham Bell quiso desarrollar un dispositivo capaz de proporcionar la palabra visible para la gente que no escuchara. Bell no tuvo éxito creando este dispositivo, sin embargo, el esfuerzo de esta investigación condujo al desarrollo del teléfono
  • Bell Labs. RECONOCIMIENTO DE DÍGITOS AISLADOS MONO LOCUTOR

    Bell Labs. RECONOCIMIENTO DE DÍGITOS AISLADOS MONO LOCUTOR
    A principios del año 1940, los laboratorios de AT&T y Bell desarrollaron un aparato primitivo que podía reconocer la voz. Estos científicos sabían que el éxito y la globalización de esta tecnología iba a depender de su habilidad de percibir información verbal compleja, con alta precisión y constancia.
  • PRIMER SISTEMA DE RECONOCIMIENTO DE VOZ

    PRIMER SISTEMA DE RECONOCIMIENTO DE VOZ
    El primer sistema de reconocimiento de voz fue desarrollado sobre una computadora analógica que reconocía dígitos del 0 al 9, este sistema era dependiente del locutor, en RCA Lab
  • RECONOCIMIENTO FONÉTICO

    RECONOCIMIENTO FONÉTICO
    Reconocedor fonético, creado en University College en Inglaterra
  • LA PRIMERA MAQUINA

    LA PRIMERA MAQUINA
    La primera máquina capaz de reconocer habla fue un perro de juguete , llamado Radio Rex, que avanzaba cuando percibía un tono de 500 hz, que coincidía aproximadamente con el primer formante de la pronunciación de la palabra "Rex", de forma que parecía que el perro avanzaba cuando se le llamaba.
  • USO DE VOCABULARIOS MAS EXTENSOS

    USO DE VOCABULARIOS MAS EXTENSOS
    Advanced Research Projects Agency (ARPA) de la sección Americana de Defensa comenzó investigaciones enfocados al habla continua y usando vocabularios mas extensos, tambien se mejoró la tecnología de reconocimiento para palabras aisladas y continuas.
  • PASOS PARA EL RECONOCIMIENTOS DE LA VOZ

    PASOS PARA EL RECONOCIMIENTOS DE LA VOZ
    Se desarrollaron técnicas para el reconocimiento de voz como: Time warping, modelado probabilístico y el algoritmo de retropropagación
  • INICIO DEL DESARROLLO DEL VOCABLO

    INICIO DEL DESARROLLO DEL VOCABLO
    Durante los 80 el reconocimiento de voz se favoreció por tres factores: el crecimiento de computadoras personales, el apoyo de ARPA y los costos reducidos de aplicaciones comerciales.
    El mayor interés era el desarrollo de vocabularios grandes
  • NORMALIZACIÓN DE LOS AÑOS 90

    NORMALIZACIÓN DE LOS AÑOS 90
    Los costos de las aplicaciones de reconocimiento de voz continuaron decreciendo y los vocabularios extensos comenzaron a ser normales. También las aplicaciones independientes del locutor y de flujo continuo (lo contrario al flujo discreto, es decir, en el habla no hay pausas significantes) comenzaron a ser más comunes.
  • CMU Sphinx

    CMU Sphinx
    CMU Sphinx (acortado como Sphinx), es el término general para describir un grupo de sistemas de reconocimiento de voz desarrollado en la Universidad de Carnegie Mellon. Incluye una serie de programas para reconocimiento de voz (Sphinx 2 - 4) y un entrenador modelo acústico (SphinxTrain).
  • AVANCES TECNOLÓGICOS

    AVANCES TECNOLÓGICOS
    La tecnología de reconocimiento de voz no nació con el iPhone 4s el primero en el que apareció Siri. La atención telefónica lleva utilizando esta forma de interacción muchos años. Y no deja de ser un reflejo de la mejora de la técnica el que la máquina antes entendiera al humano de pascuas a ramos mientras que ahora la precisión ha aumentado.
  • USO DE LA VOZ EN COMPUTADORAS Y TELÉFONOS CELULARES

    USO DE LA VOZ EN COMPUTADORAS Y TELÉFONOS CELULARES
    Que Google guarde archivos con grabaciones de nuestra voz y los suba a nuestra cuenta no tendría que ser una sorpresa para muchos, ya que lo lleva haciendo desde el año pasado, cuando lanzó la detección del "Ok Google" desde cualquier pantalla. Y no es la única compañía que lo hace, Apple con Siri también guarda la voz. Es con la activación del "Ok Google" desde cualquier pantalla cuando se comienza a guardar nuestra voz.