Caratula

Historia del Reconocimiento Digital de la Voz

  • Primeros Intentos de Producción

    Primeros Intentos de Producción
  • Christian Gottlieb Kratzenstein

    Christian Gottlieb Kratzenstein
    Científico Danés, construyó modelos del tracto vocal que podría producir las cinco vocales largas (a, e, i, o, u).
  • Alexander Graham Bell

    Alexander Graham Bell
    Quiso desarrollar un dispositivo capaz de proporcionar la palabra visible para la gente que no escuchara. Bell no tuvo éxito creando este dispositivo, sin embargo, el esfuerzo de esta investigación condujo al desarrollo del teléfono. Inicio del Reconocimiento de la Voz
  • WH Preece y A. Stroh

    WH Preece y A. Stroh
    Examinaron bajo microscopio las estrías producidas por el gramófono. Intentan descubrir la Naturaleza Física de los sonidos
  • ARTEFACTOS QUE RECONOCEN LA VOZ

    ARTEFACTOS QUE RECONOCEN LA VOZ
    Los laboratorios de AT & T y Bell desarrollaron artefactos primitivos que podían reconocer la voz. Éstos científicos sabían que el éxito y la globalización de esta tecnología iba a depender de su habilidad de percibir Información verbal COMPLEJA, con alta precisión.
  • MODELADOR DE TRACTO VOCAL

    MODELADOR DE TRACTO VOCAL
    Se creo un modelador de tracto vocal y se lograba un gran mejora de los resultados con respecto a los proporcionados por el Voder.
  • Aplicaciones de la modulación de la Voz

    Aplicaciones de la modulación de la Voz
    Comenzaron a realizar aplicaciones con vocabularios pequeños,dependientes del locutor y con palabras de flujo discreto
  • Primer sistema de reconocimiento de voz

    Primer sistema de reconocimiento de voz
    EL primer sistema de reconocimiento de voz fue desarrollado en 1952 sobre una computadora analógica que reconocía dígitos del 0 al 9,este sistema era dependiente del locutor
  • DEPENDIENTES DEL LOCUTOR

    DEPENDIENTES DEL LOCUTOR
    Dependientes de locutor. Flujo discreto de habla,( con espacios/ pausa entre palabras). Vocabulario pequeño ( menor o igual a 50 palabras.
  • Primer sistema de reconocimiento de voz comercial

    Primer sistema de reconocimiento de voz comercial
    Se mejoraron las aplicaciones de los sistemas dependientes del locutor que requerían una entrada discreta y tenia un vocabulario pequeño.
  • CALCULADORA PARA CIEGOS

    CALCULADORA PARA CIEGOS
    Dispositivos móviles electrónicos incluyendo síntesis de voz comenzaron a aparecer en los setentas. Unos de los primeros fue la calculadora para ciegos Speech+ de Telesensory Systems Inc. (TSI)
  • Desarrollo del vocablo

    Desarrollo del vocablo
    El reconocimiento de voz se favoreció por tres factores: el crecimiento de computadoras personales, el apoyo de ARPA y los costos reducidos de aplicaciones comerciales. También durante esta época hubo grandes avances tecnológicos, ya que se cambió del enfoque basado en reconocimiento de patrones a métodos de modelado probabilísticos, como los Modelos Ocultos de Markov (HMM)
  • VIDEO JUEGO CON SINTETIS DE VOZ

    VIDEO JUEGO CON SINTETIS DE VOZ
    El primer videojuego en incluir la síntesis de voz fue el arcade shoot 'em up, Stratovox, de Sunsoft
  • Años 90

    Años 90
    Los costos de las aplicaciones de reconocimiento de voz continuaron decreciendo y los vocabularios extensos comenzaron a ser normales. También las aplicaciones independientes del locutor y de flujo continuo (lo contrario al flujo discreto, es decir, en el habla no hay pausas significantes) comenzaron a ser más comunes.
  • AT&T "Voice Recognition Call Processing System"

    AT&T "Voice Recognition Call Processing System"
    AT&T introdujo su Voice Recognition Call Processing System en: 1992 (llamadas por cobrar, por cargo a tarjeta de crédito, cargos a terceros) a finales de 1993 procesaba 50 millones de llamadas al mes.
  • CONVERSION DE TEXTO HABLA

    CONVERSION DE TEXTO HABLA
    El sistema, puesto a la venta en 1994, permite una conversión de texto-habla basada en una completa articulación usando una guía de ondas o una línea de transmisión análoga de la voz humana y conductos nasales controlados por el "modelo distintivo de región" de Carré.
  • Marcado activado por voz de celulares

    Marcado activado por voz de celulares
    En 1995 teléfonos celulares ya ofrecían servicios de marcado activado por voz
  • Procesamiento del lenguaje natural para responder preguntas

     Procesamiento del lenguaje natural para responder preguntas
    Salio a la luz el reconocimiento de voz Siri. Hace funciones de asistente personal a veces con su propia personalidad para iOS, macOS, tvOS y watchOS. Esta aplicación utiliza procesamiento del lenguaje natural para responder preguntas, hacer recomendaciones y realizar acciones mediante la delegación de solicitudes hacia un conjunto de servicios web que ha ido aumentando con el tiempo.
  • Telefonía

    Telefonía
    Algunos sistemas PBX permiten a los usuarios ejecutar comandos mediante el habla, en lugar de pulsar tonos. En muchos casos se pide al usuario que diga un número para navegar un menú.