¿Traductores militares de bolsillo del futuro? Final

12
Deje que una persona, en interacción con un traductor de computadora, limite sus requisitos a marcos estrictos y predecibles en los que no haya lugar para vivir la espontaneidad, y la computadora recibirá condiciones de trabajo cómodas que satisfacen su esencia técnica, más que viva, ¡que no está en ella y no puede estar!





Guiado por esta formulación del problema, llevo siete años trabajando durante los últimos dos años para patentar (me enorgullece que los estadounidenses hayan pasado sus años 6 para obtener su patente en Rusia). Registré mi invento en el verano de 2017, el número de patente de 2628202 denominado "Adaptativo al contexto". traducción automática "(disponible en el sitio web de Rospatent).

De esta manera, todo funcionará así. El usuario oralmente o por escrito establece el sistema de traducción algún texto. El sistema no lo acepta por completo, como los sistemas anteriores, pero cada frase completa de la oración por separado, inmediatamente comienza a traducir esta frase. En la pantalla de su dispositivo, el usuario, después de cada frase de su texto, ve otra frase en su idioma nativo, la llamada frase estándar, que el sistema encontró en su memoria como un análogo que refleja con mayor precisión el significado de lo que se dice en la frase establecida por el usuario. Junto con la frase estándar, los nombres de aquellos que pueden corresponder a esta frase aparecen en la pantalla. El usuario selecciona el tema deseado y da un comando para traducir, después de lo cual la frase estándar se traduce de manera precisa y sin ambigüedades a un idioma extranjero en forma de una frase estándar en el sistema en ese idioma.

Si el texto especificado contiene una frase para la cual no hay una frase estándar correspondiente en la memoria del sistema, entonces, junto con el texto completo que el usuario especifica para la traducción, ingresa a una fuente de información confiable, donde los lingüistas y traductores seleccionan el análogo estándar y el tema para él. Trasladarlo y ponerlo todo en la memoria del sistema.

Si el usuario ve una frase estándar en la pantalla, un par de frases del texto, pero no vio la que correspondería al significado de la frase entre el conjunto, escribe el nombre del tema deseado y lo envía a la fuente de información confiable, y allí aparece la traducción estándar correspondiente de la frase y Además, todo está puesto en la memoria del sistema.

Por eso se repone continuamente, se enriquece y es autodidacta. Y será bastante adecuado para trabajar con gadgets de usuarios individuales ordinarios, es para ellos lo que está destinado principalmente.

Pero para los traductores profesionales, también puede facilitar el trabajo mucho más racionalmente que los sistemas de traducción estadística. Aquí es cómo se verá.

El traductor le da una señal al sistema: "¡Trabajos profesionales!" Después de eso, lanza su texto, mira la pantalla, selecciona temas para frases estándar y da comandos para la traducción. Después de recibir todo lo que el sistema pudo traducir, él mismo traduce frases que el sistema no pudo dominar. Luego, la traducción final de todo el texto se envía al sistema a la fuente de información confiable, donde, por consiguiente, se procesa y se coloca en el sistema. Luego, el traductor, si lo necesita, requiere que el sistema traduzca este texto a varios otros idiomas. Y el sistema lo hará literalmente instantáneamente, porque cada oración en el texto tiene frases pareadas estándar elegidas de forma única y sus temas correspondientes, por lo que no hay necesidad de "pensar", solo una búsqueda pura y una búsqueda en bases de datos.

Si realmente no profundiza en él, entonces puede surgir la pregunta: ¿cómo es mi propuesta mejor que el método estadístico, si el problema fundamental de los perseguidores perpetuos detrás del habla en vivo no ha desaparecido en ninguna parte? Formalmente, lo es. Pero procedí del hecho de que cuando las personas multilingües simples se comunican entre sí, por lo general lo hacen por un tiempo corto y superficialmente, como conocidos temporales e informales, e incluso de forma apresurada. Están ansiosos por transmitir información breve y precisa con un pequeño conjunto de temas y, en este caso, mi propuesta será bastante eficiente y de gran demanda. Especialmente cuando la gente se acostumbra a trabajar con este sistema. Estoy más que seguro de que comenzarán a memorizar con placer las frases estándar del sistema, para no esperar su selección si dicha frase no es estándar. Entre los jóvenes, hablar con frases estándar que un gadget puede traducir inmediatamente a otro idioma puede convertirse en una moda, una tendencia, una tendencia general, o como lo llaman a su manera.

Inmediatamente surge la pregunta: ¿cuál debería ser la base del habla para futuras frases estándar en el sistema de traducción sensible al contexto? Creo que el lenguaje de la literatura estándar en todos los idiomas del mundo debería convertirse en la base de las frases estándar en el sistema computarizado de traducción temática contextual. Y lo propongo de ninguna manera por consideraciones morales, educativas o estéticas, sino puramente prácticas. El habla clásica es fácil de asimilar, perfectamente entendida por hablantes nativos y traducida de manera rápida, precisa y tersa al discurso literario-clásico extranjero. Este método de traducción automática está destinado principalmente a la comunicación directa de personas multilingües entre sí. Y si se implementa con éxito, esto debería aumentar dramáticamente los flujos en todos los tipos de turismo internacional. Por lo tanto, los operadores del negocio turístico tienen una razón directa para ayudar en la implementación de este método, con el segmento más masivo y sin complicaciones de su segmento, que se convertirá en la base para el desarrollo más profundo y profundo de dichos sistemas de traducción automática.

El mismo segmento fundamental tendrá un serio significado militar, porque los primeros traductores de bolsillo aparecieron solo en el ejército, más precisamente, en el Ejército de los EE. UU. En territorio iraquí en algún lugar del año 2003. Estos fueron dispositivos de voz primitivos, que contienen conjuntos temáticos de comandos y frases estándar con traducción de voz al árabe para la comunicación más sencilla con la población local, la policía y el ejército. Estos conjuntos de conversación se realizaron de acuerdo con el tipo de libros de frases disponibles en las guías turísticas, que ahora se pueden comprar antes de viajar a cualquier país. Por cierto !! Se trata de los libros de frases de guía con sus frases de frase "frase-traducción", simples pero necesarias para el viajero, distribuidas por tema, de modo que sea fácil de encontrar en el librito y me sugieran la dirección en la que, en mi opinión, es necesario organizar y desarrollar el sistema de conversación. traducción automática!

Entonces ... Nuestro ejército se ve cada vez más involucrado en las operaciones internacionales para reprimir el terrorismo, en algún lugar en el que nuestros militares realizan funciones de mantenimiento de la paz, por lo que necesitan absolutamente la capacidad de comunicarse fácilmente con las administraciones locales y el público. Por lo tanto, creo que este método será el más adecuado para ellos, porque es rápido y fácil de aprender, y también se lleva bien con el vocabulario oficial y cotidiano al que están acostumbrados los militares. Y a los militares se les enseña un vocabulario de este tipo, breve, amplio, que transmite la esencia misma de los mensajes, sobre todo los requisitos de la carta, un ejemplo del lenguaje en el que está escrito. Así que creo que al desarrollar un sistema de traducción sensible al contexto, especialmente en las primeras etapas, es necesario crear una función de habla similar a las regulaciones del ejército, que contendría requisitos claros y ejemplos para desarrollar frases estándar establecidas en el glosario del sistema.

Ahora sobre las ventajas técnicas de la traducción contextual. En primer lugar, es una simplificación drástica del software. En lugar de los programas más complicados de análisis estadístico, la búsqueda, la comparación, los programas simples de búsqueda comparativa simple en bases de datos pasan a primer plano. Y esto dará, en mi opinión, no solo una nueva calidad de traducción, sino también un gran ahorro en el poder de cómputo, junto con el ahorro de energía. Después de todo, según M. Kovalchuk, director del Instituto Kurchatov, una simple solicitud de voz de un teléfono inteligente "consume" energía tanto que se puede hervir un litro de agua, ¡y una tercera parte de toda la electricidad en los Estados Unidos va solo a los centros de datos de Google!

Los programas de análisis morfológico y sintáctico pasarán a la vanguardia de los programas analíticos para ayudar al personal con fuentes de información confiable para coordinar todas estas conjugaciones, tiempos, casos, signos de puntuación, etc., con prontitud. Y estos programas tampoco son tan serios. Preveo que a medida que se desarrollen los sistemas de traducción contextual, otros tipos de programas que ya están desarrollados y operan en la traducción automática encontrarán su uso, pero creo que se adaptarán a varios otros principios, comenzarán a funcionar de manera más eficiente, más precisamente, más económicamente utilizando computacionalmente. Potencia de los sistemas de traducción automática.



PD: Quiero agregar que dentro del marco de la información que se supone que se proporciona en la documentación de la patente, es simplemente imposible establecer todo lo que constituye la esencia completa de la invención y los métodos de su implementación. Por lo tanto, el equipo que comenzará a implementar este proyecto en la vida, puedo decir muchas cosas que pueden ahorrar significativamente su tiempo, recursos y, lo más importante, esfuerzos intelectuales.

PPS En los comentarios a las partes anteriores de mi artículo, se dijo que los intérpretes de voz cometen la mayoría de los errores a expensas del sistema de reconocimiento de voz de los usuarios, y si las frases se escriben simplemente en los teléfonos inteligentes por escrito, la calidad de la traducción mejora dramáticamente, especialmente en Google. Bueno, en primer lugar, nos interesaba la posibilidad de que los intérpretes de voz se comuniquen con nuestros enfermeros y enfermeros con pacientes no pacientes. En segundo lugar, utilizamos aplicaciones de traducción, donde en la pantalla del teléfono inteligente la frase hablada primero aparece por escrito, se puede leer y luego se le da un comando para la traducción de voz. Google Translate también probó, en nuestro caso, no fue mejor que todos los demás. Después de estas pruebas, en nuestro Centro de Cosmetología y Corrección Antropométrica (Ortopédica), apareció un entretenimiento constante: grupos de pacientes rusos y extranjeros se reúnen periódicamente con enfermeras o enfermeras desempleadas, sacan sus aparatos e intentan hablar con los extranjeros. La risa aquí es simplemente histérica, especialmente si hay pacientes entre nuestros pacientes con buen inglés o algún otro idioma que pueda explicar cómo se debería haber traducido la frase y cómo el gadget la tradujo en especie. Por lo tanto, tengo la oportunidad de probar casi constantemente todos los sistemas de la traducción informática actual.
12 comentarios
información
Estimado lector, para dejar comentarios sobre la publicación, usted debe login.
  1. +5
    6 de octubre 2018 06: 21
    Entre los jóvenes, hablar con frases estándar que un gadget puede traducir inmediatamente a otro idioma puede convertirse en una moda, una tendencia, una tendencia general, o como lo llaman a su manera.

    Como resultado, nos comunicaremos así:
    - Camino de la tienda a las dos del futuro.
    - Sorpresa. Creo que pasas la tienda más allá.
    - Me voy a dormir. Llegada tarde
    Creo que el lenguaje de la literatura estándar en todos los idiomas del mundo debería convertirse en la base de las frases estándar en el sistema computarizado de traducción temática contextual.

    Aquí una de dos cosas, ya sea frases estándar o toda la riqueza de un idioma.

    La variante de aprender el sistema de traducción ofrecido por el autor se parece a VIKI. La idea es buena, pero el resultado no es impresionante.
    Así que creo que cuando se desarrolla un sistema de traducción sensible al contexto, especialmente en las primeras etapas, se debe crear una función de habla, similar a las regulaciones del ejército, que contendría requisitos claros y ejemplos para desarrollar frases estándar.

    Entonces, ¿no es más fácil cambiar a jeroglíficos? Aquí tiene un conjunto de signos 2000, combinación que se puede comunicar completamente. Cada jeroglífico capta el significado en el idioma y eso es todo. Más fácil aún: no jeroglíficos, sino números. Y la conversación de una empresa multilingüe será como en un chiste.

    - Una vez más se reúne la misma empresa. Todos los chistes ya están contados, por lo que la compañía decide contar chistes por números. Aquí se sientan, pereuchuyvayutsya:
    - ¡Broma #325!
    - Ja ja ja ja!
    - ¡Broma #719!
    - Ja ja ja ja!
    - ¡Broma #18!
    - Ja ja ja ja!
    - ¡Broma #133!
    - Ja ja ja ja!
    Entonces, uno de la compañía comienza a reír a carcajadas, rodando por el suelo, de ninguna manera puede parar.
    - ¿Qué te pasa?
    - ¡Todavía no he escuchado este chiste!
    1. +2
      6 de octubre 2018 06: 35
      ..... candidato .. Adelante ... sonreír
    2. El comentario ha sido eliminado.
  2. +7
    6 de octubre 2018 06: 56
    Mikhail Goldreer
    Sin ofender al autor conocido en el sitio, pero este es otro artículo para autopromoción. Yo, mi patente ...
    1. +7
      6 de octubre 2018 08: 42
      Sin ofender a nadie, diré que una persona ha hecho algo. Estoy de acuerdo, la crítica también es buena. Gracias a ella, puedes ver lo que no pasé por alto. Es una pena que no haya ejemplos de traducción, por lo que uno solo puede adivinar cómo debería funcionar esta invención, pero ahora estoy hablando de otra cosa. ¿Qué hay de malo en la autopromoción? Tal vez el autor de este artículo no tiene mucho tiempo y se comunica solo en unos pocos sitios, y escribir el artículo en sí lleva un tiempo decente ... ¿Tal vez fue suficiente para agradecer el trabajo, que en el futuro cercano recibirá una evaluación objetiva? EN MI HUMILDE OPINIÓN.
  3. +3
    6 de octubre 2018 10: 30
    El hombre sugiere retroceder dos generaciones en traductores.
    El tipo propuesto es la tecnología obsoleta desde hace mucho tiempo. Que acaba de ser reemplazado por traductores en modelos estadísticos, y ya están siendo reemplazados activamente por redes neuronales.
    1. 0
      16 de octubre 2018 08: 41
      Estoy de acuerdo, pero las redes neuronales son un callejón sin salida, las introduje en estos sistemas y me robaron mi "idea", pero me robaron la idea y quedó inoperable y les dejo romper lanzas, porque no entienden nada, y me reiré de ellos
  4. +1
    7 de octubre 2018 06: 45
    Leí el artículo y recordé cómo nos llevaron a un departamento de idiomas extranjeros en una escuela de ingeniería militar. El más mínimo enganche en la traducción y ve al final de la línea. Todos estos textos enormes, los interrogatorios de prisioneros de guerra, etc., no fueron útiles en el servicio, y mucho, casi cuarenta años después, fue olvidado. En cuanto al artículo, se cree que estos traductores de bolsillo eventualmente aparecerán en el ejército. Muy práctico.
  5. +2
    8 de octubre 2018 10: 43
    Mi abuelo es un capitán de infantería ordinario del 1er Frente Bielorruso, comandante de batallón, en esa guerra solo logró algunas frases: "Alto, Hyundai hoh, tsuryuk, schnapps" y ya estaba harto de ellos ... riendo
  6. 0
    9 de octubre 2018 21: 41
    Según el director del Instituto Kurchatov M. Kovalchuk, una simple solicitud de voz desde un teléfono inteligente "consume" tanta energía que se puede hervir un litro de agua, ¡y un tercio de toda la electricidad en los Estados Unidos va solo al funcionamiento de los centros de datos de Google!
    La batería más grande en el teléfono inteligente es 6-8 mil mA / h. Y para hervir un litro de agua, necesita al menos un hervidor 700 W (el más barato) y, a manera de cálculos complicados, descubrimos que apenas calentamos un poco de agua. Y 1 / 3 generan toda la electricidad. Es decir, no hay plantas, no hay iluminación, y en general los consumidores ... ¿Qué tipo de tonterías?
    1. 0
      11 de octubre 2018 07: 53
      Tal vez estamos hablando de un ciclo completo de procesamiento de solicitudes?
  7. 0
    16 de octubre 2018 08: 37
    Llevo mucho tiempo interesado en este tema ..... la patente me decepcionó, en el fondo de mi alma, mi difunta madre, quien desarrolló algoritmos ultrasecretos para el submarino hace muchos años, enfrentó la defensa de una disertación con un diploma, quien creía que allí se podía hacer algo para simplificar el programa .. ... bueno, con métodos manuales para terminar. Comprenda y recuerde que "¡un programa eficaz debe funcionar de manera confiable y sin participación humana!" Si el operador resuelve las dificultades, entonces el programa no tiene éxito, es débil y simplemente irrealizable, ¿de dónde vendrán sus expertos? ¿quién les pagará? ... y usted escribe sobre la simplificación del software ...... !!!!! Entiende que la computadora de hierro déjala funcionar, fue creada para que los operarios descansen, y no al revés. ¿Qué quiere decir con la complejidad de un algoritmo? ¿Número de líneas? ¿Inteligencia de la lógica? ¿Qué es difícil en la vida? ¿Y en qué se diferencia lo complejo de lo simple? El complejo se diferencia del simple solo en el grado de ignorancia de una persona en particular.
  8. 0
    7 diciembre 2018 11: 07
    No diré para los traductores de bolsillo, pero la falla fundamental de los traductores electrónicos es obvia: reducción a la unicidad. Mantas de jabón ... que Polvo o cubrir? En el primer caso, "jabón" es un verbo y "cubierto" un sustantivo; en el segundo "jabón" - pl. h. de "jabón", y "velos" es un verbo.
    Deje que el ejemplo sea artificial, pero ocurre uno similar aquí y allá, que a menudo influye en la coordinación. De lo que se deduce que un buen traductor automático es fundamentalmente imposible.
    Solo posible semiautomáticocuando se le ofrece al usuario la opción de varios significados de palabras y varias combinaciones posibles de relaciones.
    Hacer esto es generalmente simple. Pero se interpone en el camino (te reirás) mensajes de texto formato. Un buen traductor producirá listas de palabras posibles en lugar de un resultado específico; todo lo que se necesita es un mecanismo conveniente para trabajar con tal estructura, de modo que gradualmente, usando elecciones simples, se convierta en un texto significativo. Y hacer esto mediante, digamos, HTML es tan fácil como pelar peras. Pero los desarrolladores se atascaron: ¡el traductor solo debería producir el resultado final! Como anunció uno de los conocidos del valiente soldado Švejk: ¡todo o nada! "Bueno, no tengo nada", explicó Schweik.