El automóvil impulsado por voz de Ford podría llegar pronto

Muy pronto, es posible que pueda decirle a su vehículo qué hacer, ¡y lo escuchará! Al menos eso es lo que revela esta nueva patente que se le ha otorgado a Ford.

A Ford se le ha otorgado una patente para tecnología de conducción autónoma que le permitirá controlar su vehículo con solo comandos de voz. No, no solo cambie la estación de radio o encienda los calentadores de los asientos, sino que haga que el vehículo acelere, cambie de carril, se detenga, etc.

En este artículo, analizaremos el procesamiento del lenguaje de vehículos de Ford, patente de EE. UU. 10,957,317. La fecha de publicación es el 23 de marzo.rd, 2021 y la fecha de presentación es el 18 de octubre.th, 2020. Esta patente ha sido otorgada como novedad por la USPTO.

Fondo

En su forma más simple, el procesamiento del lenguaje natural (PNL) es un método informático en el que las computadoras pueden comunicarse con los humanos a través del habla natural. Una persona puede realizar una solicitud a su teléfono y el teléfono responderá con una frase o acción basada en un algoritmo con una puntuación de confianza. Lo hacemos todo el tiempo. El puntaje de confianza es un valor asignado a una salida de un sistema de PNL donde la computadora dice «… Estoy 90% seguro de que esto es de lo que estás hablando, así que aquí tienes …».

Es un sistema extremadamente complejo que ha mejorado drásticamente en los últimos 20 años. Si alguien recuerda finales de mediados de la década de 2000, recuerda hablar con un teléfono y hace exactamente lo contrario de lo que solicitó. Ni siquiera fue frustrante, simplemente nunca lo volviste a usar.

Bueno, esos días han quedado atrás. La PNL ha avanzado hasta un punto en el que podemos conversar con nuestra electrónica casi sin problemas. Ahora que la PNL funciona como lo hace, es lógico aplicarla a un automóvil.

Intro

Ford, junto con casi todos los demás fabricantes de automóviles, ya usa NLP en sus automóviles para hacer cosas como ajustar la radio, llamar a la gente o controlar los controles del clima. Estas son situaciones de riesgo bastante bajo. Si su automóvil cambia a la estación de radio incorrecta, no es gran cosa. Pero, ¿y si pudieras controlar el movimiento de tu coche con tu voz?

Ford está introduciendo un sistema para hacer precisamente eso. Podrás controlar los frenos, la aceleración, el volante, etc… con solo tu voz. ¿No es un poco aterrador? Además de controlar su automóvil, Ford también está abordando en gran medida el ruido ambiental con este sistema, donde el automóvil puede filtrar el ruido de fondo de la orden del conductor para una comprensión más clara del habla.

Novedad prevista

La novedad pretendida aquí se relaciona con el proceso de comprensión del lenguaje natural. El sistema utiliza un modelo de ruido del vehículo (filtro), que está capacitado para comprender las voces y cualquier otro ruido no útil proveniente del automóvil. El sistema tomará un comando de voz y ruido, filtrará el ruido y proporcionará el comando de voz con una puntuación de confianza, donde la puntuación de confianza se determina después del modelo de ruido del vehículo.

Por qué

Ford no tiene una declaración de problema explícita, pero es bastante obvio que están trabajando para mejorar los comandos de voz, especialmente si los comandos de voz controlan el automóvil. Si yo fuera un hombre de apuestas, diría que Ford quería usar un sistema de voz a texto ya existente, pero no funcionó lo suficientemente bien como para justificar operar un automóvil con él. Entonces, crearon este filtro de ruido para mejorar los puntajes de confianza de una frase de comando, lo que puede permitir que el sistema realmente opere un automóvil.

Qué

Primero, el sistema solo funcionará en modo autónomo. Ford define su posición sobre lo que es un vehículo semiautónomo y totalmente autónomo:

… Un modo autónomo se define como uno en el que la propulsión del vehículo (por ejemplo, a través de un sistema de propulsión que incluye un motor de combustión interna y / o motor eléctrico), el frenado y la dirección son controlados por una o más computadoras del vehículo; en un modo semiautónomo, las computadoras del vehículo controlan uno o dos de la propulsión, el frenado y la dirección del vehículo. En un vehículo no autónomo, ninguno de estos está controlado por una computadora.

No es ningún secreto que los automóviles se están volviendo autónomos, y Ford afirma que ya tienen sistemas que pueden controlar la ruta de un automóvil en función de los datos del ‘entorno externo’. El automóvil está diseñado para detectar información de la carretera, incluidos otros automóviles y peatones. Luego, el automóvil puede calcular una ruta a un destino en función de la información detectada. Lo hacen creando un ‘polinomio de ruta’. Nada de esto es una sorpresa.

La razón de este documento es que el conductor ahora puede controlar el polinomio de ruta con su voz. El sistema utilizará un sistema de voz a texto y luego aplicará un algoritmo de PNL para determinar lo que dijo. Entonces, el coche actuará según lo que dijiste. Ford ofreció un ejemplo conciso:

… los comandos de lenguaje hablado como «girar a la izquierda», «acelerar», «reducir la velocidad», etc. pueden ser hablados por un ocupante. Estos comandos de lenguaje hablado se pueden adquirir y procesar para determinar los comandos del vehículo que pueden ser recibidos por un dispositivo informático e interpretados para proporcionar información que se puede utilizar para dirigir el funcionamiento del vehículo.

La Figura 1 (arriba) muestra todo el sistema en cuestión. En esta figura, no nos preocupa la red, el servidor o el dispositivo móvil. Solo nos preocupamos por el Vehículo 110 y todo lo que contiene. La interfaz V-to-I es un sistema de interfaz de voz. Este es el término general para el sistema de voz a texto a NLP a comando. Observe cómo esta interfaz está conectada al tren motriz, los frenos, la dirección, la computadora y los sensores. Esto significa que podrá controlar el motor, los frenos y la dirección con su voz. ¡Loco!

Ford también afirma que los sistemas de PNL pueden ser Siri de Apple o Alexa de Amazon. Probablemente sea aconsejable que utilicen uno de estos sistemas porque probablemente sean los mejores en función de la cantidad de dinero que estas empresas invierten en sus sistemas de PNL, aunque las licencias probablemente sean caras.

Los sensores alrededor del automóvil afectarán la forma en que el automóvil reaccionará a su comando. Por ejemplo, si dices “coche, acelera a 200 mph” y el coche sabe que hay otro delante de él, tu coche no acelerará según tu estupidez. Ford afirma que los sensores pueden ser:

… Altímetros, cámaras, LIDAR, radar, sensores ultrasónicos, sensores infrarrojos, sensores de presión, acelerómetros, giroscopios, sensores de temperatura, sensores de presión, sensores de pasillo, sensores ópticos, sensores de voltaje, sensores de corriente, sensores mecánicos como interruptores, etc.

Curiosamente, junto con los datos de detección normales sobre la posición de la dirección, la presión de los frenos, etc., los sensores también pueden detectar información meteorológica:

… [the] Los sensores pueden detectar fenómenos como las condiciones meteorológicas (precipitación, temperatura ambiente externa, etc.), la pendiente de una carretera, la ubicación de una carretera (p. ej., utilizando bordes de carreteras, marcas de carriles, etc.) o ubicaciones de objetos objetivo como como vehículos vecinos.

Entonces, digamos que está en la carretera, y digamos que le ha dicho al automóvil que cambie de carril, y los sensores tienen todos sus datos ambientales, ¿qué sigue? En este caso, la computadora asignará un carril, asignará una velocidad y asignará al carril adyacente una etiqueta de ‘vacío o lleno’. Si el carril está vacío, el automóvil cambiará de carril. De lo contrario, el coche se quedará donde está.

«… en la escena del tráfico, el estado del vehículo puede incluir» en el carril 204 «,» velocidad = velocidad objetivo «y» carril adyacente 206 = vacío «… la máquina de estado basada en reglas puede generar un comando del vehículo igual a» realizar un cambio de carril izquierdo «Al dispositivo informático …»

El automóvil no solo puede actuar según sus órdenes, sino que también puede responderle. En el ejemplo anterior, si el carril está abierto, el automóvil le dirá que cambiará de carril en un período de tiempo determinado.

…[the system] también puede enviar un mensaje a un ocupante de un vehículo 110, para informar al ocupante de un comando del vehículo…. [for example, the system may response with] un mensaje que dice «cambio de carril izquierdo en t segundos» …

En una inmersión más profunda en la idea, Ford aplicará una puntuación de confianza al comando. Esto es importante porque aquí es donde está la novedad. Recuerde, un puntaje de confianza es solo un valor asignado a un comando, donde el valor dice «Estoy bastante seguro de que esto es de lo que está hablando, esperemos tener razón o ambos estamos en problemas».

La siguiente tabla muestra una frase de ejemplo con puntuaciones de confianza asignadas. Cuanto más alta sea la puntuación, más seguro estará el coche para reaccionar a tu orden. Y sí, Ford ha llamado a su coche «Henry». ¡Qué apropiado!

La parte interesante de esta idea en particular es que Ford también está aplicando un modelo de ruido del vehículo (en realidad, es un filtro), donde el automóvil reconocerá una voz y conocerá todos los demás ruidos que no deberían usarse. Filtrará el ruido y luego proporcionará la puntuación de confianza. Casi puedo garantizarle que este modelo mejoró los puntajes de confianza en una cantidad significativa, por lo que será un gran componente de este sistema.

En resumen, el modelo de ruido del vehículo detectará el ruido ambiental, como el ruido de la carretera, el ruido del viento, otras conversaciones, música, etc., junto con la voz, para producir un «comando de lenguaje hablado ruidoso». Entonces, el sistema separará el ruido y el comando, y solo proporcionará el comando al sistema NLP. Es genial que tengan una idea para resolver este problema.

Conclusión

Al final, Ford está desarrollando un sistema para controlar su automóvil con su voz y mejorar el reconocimiento de voz con un filtro de ruido. Puede parecer mundano para un espectador externo, pero este es un paso importante hacia un sistema de control de voz utilizable para su automóvil. Aún más, si esto termina funcionando bien, probablemente se aplicará a todos los comandos de voz en un automóvil, no solo a los comandos operativos (si aún no lo ha hecho).

Si está nervioso por esta perspectiva, recuerde que estamos hablando de Ford. No van a lanzar nada como esto a menos que estén 100% seguros de que funciona el 99,9% del tiempo.

Pero tampoco olvidemos que sus comandos probablemente se registrarán en los servidores de Ford. Todo lo que diga, al igual que Siri y Alexa, se guardará en sus computadoras. Estoy seguro de que se utilizará para entrenar sistemas futuros para que funcionen con mayor precisión, pero ¿cómo se siente al respecto?

Aún más, la gran pregunta es: ¿usaría esto en su automóvil?

Deja un comentario