AWS Application Services para IA/ML

En este articulo, conoceremos los servicios de IA de AWS para crear chatbots, análisis de texto avanzado, análisis de documentos, transcripción, etc. Este articulo se ha diseñado de tal manera que puede resolver diferentes casos de uso integrando los servicios de IA de AWS y hacerse una idea de cómo funcionan. AWS crece todos los días y están agregando nuevos servicios de inteligencia artificial con regularidad.

Amazon Rekognition

Rekognition Image permite crear fácilmente aplicaciones poderosas para buscar, verificar y organizar millones de imágenes. Rekognition Video permite extraer contexto basado en movimiento de videos almacenados o transmitidos en vivo, y lo ayuda a analizarlo. Rekognition Video también le permite indexar metadatos como objetos, actividades, escenas, celebridades y rostros, lo que facilita la búsqueda de videos. Rekognition Image utiliza modelos de redes neuronales profundas para detectar y etiquetar miles de objetos y escenas en sus imágenes. Le ayuda a capturar texto en una imagen, un poco como el reconocimiento óptico de caracteres (OCR). Un ejemplo perfecto es una camiseta con comillas. Si tomara una foto de uno y le pidiera a Amazon Rekognition que extrajera el texto de él, podría decirle lo que dice el texto. También puede realizar el reconocimiento de celebridades con Amazon Rekognition. No soy una celebridad, por lo que no utilizaré la API de reconocimiento de celebridades para mi rostro; en su lugar, usaré la API de comparación de rostros.

Beneficios

AWS administra la infraestructura en la que se ejecuta. En resumen, solo se usa la API para el análisis de la imagen. Solo tenemos que concentrarnos en construir y administrar nuestros deep learning pipelines.

La respuesta de la API Labels identificará entidades del mundo real dentro de una imagen a través de la API DetectLabels.

Amazon Rekognition se puede integrar con AWS Kinesis Video Stream, AWS S3 y AWS Lambda para un análisis de imágenes y video fluido y asequible. Con el servicio AWS IAM, las llamadas a la API de Amazon Rekognition se pueden proteger y controlar fácilmente.

Bajo costo. Solo paga por las imágenes y videos que se analizan.

Amazon Polly

Amazon Polly consiste en convertir texto en voz y lo hace utilizando modelos de deep learning previamente entrenados. Es un servicio completamente administrado, por lo que no tenemos que hacer nada. Se debe proporcionar el texto sin formato como entrada para sintetizar o en formato Speech Synthesis Markup Language (SSML) para que se devuelva audio. También lo ofrece en diferentes idiomas y voces para elegir, con opciones tanto masculinas como femeninas. El audio de salida de Amazon Polly se puede guardar en formato MP3 para su uso posterior en la aplicación (web o móvil) o puede ser una salida JSON para voz escrita.

Beneficios

Este servicio es completamente administrado y no requiere ningún costo administrativo para mantener o administrar los recursos.
Proporciona una función de mejoras y correcciones de voz instantáneas.
Se puede desarrollar su propia capa de acceso utilizando la API HTTP de Amazon Polly. El desarrollo es fácil debido a la gran cantidad de lenguaje soportados, como Python, Ruby, Go, C ++, Java y Node.js.
Para ciertas voces neuronales, el habla se puede sintetizar utilizando el estilo Newscaster, para que suene como una emisora de radio o televisión.

Amazon Transcribe

Transcribe permite realizar la conversión de voz a texto. Es un servicio de reconocimiento de voz automático que utiliza modelos de aprendizaje profundo previamente entrenados, lo que significa que no tenemos que entrenar en petabytes de datos para producir un modelo; Amazon hace esto por nosotros. Solo tenemos que usar las API que están disponibles para transcribir archivos de audio o videos; admite varios idiomas diferentes y también vocabulario personalizado.

Casos de uso:

Transcripción y transmisión de audio en tiempo real.
Transcripción de archivos de audio pregrabados.
Habilitar la búsqueda de texto desde un archivo multimedia combinando AWS Elasticsearch y Amazon Transcribe.
Realización de análisis de opinión en archivos de audio grabados para el servicio de asistencia por voz (análisis del centro de contacto).
Separación de identificación de canales.

Amazon Comprehend

Este servicio le ayuda a extraer conocimientos de texto no estructurado. La información de texto no estructurado está creciendo exponencialmente.

Beneficios

Detecta el idioma del texto y extrae frases clave. Amazon Comprehend también se puede utilizar para el análisis de opiniones y el modelado de temas.
Amazon Comprehend Medical se puede utilizar para extraer información médica.
Se paga por lo que usa, ya que este es un servicio completamente administrado; no tiene que pagar por la infraestructura. No necesita entrenar, desarrollar e implementar su propio modelo.
El servicio de modelado de temas funciona extrayendo hasta 100 temas. Un tema es un grupo de palabras clave para que pueda ver lo que hay en el corpus real de documentos.
Es preciso, entrenado continuamente y fácil de usar.

Amazon Translate

Amazon Translate es un servicio de traducción de texto. Podemos proporcionar documentos o cadenas de texto en varios idiomas y recuperarlos en otro idioma. Utiliza técnicas de aprendizaje profundo previamente entrenadas, por lo que no deberíamos preocuparnos por los modelos ni por cómo se gestionan. Podemos realizar solicitudes de API y recuperar los resultados.

Beneficios

Utiliza la traducción automática neuronal, que imita la forma en que funciona el cerebro humano.
No es necesario mantener sus recursos.
Produce resultados de alta calidad y mantiene su consistencia.
Puede personalizar los nombres de sus marcas y modelos, y cualquier otro término exclusivo se traduce mediante la función de terminología personalizada.
Puede integrarse fácilmente con aplicaciones a través de API.
Amazon Translate se escala solo cuando lo necesita para hacer más.

Amazon Lex

La mayoría de las funciones que están disponibles en Alexa son impulsadas por Amazon Lex. Puede crear fácilmente un chatbot con Amazon Lex. Utiliza la comprensión del lenguaje natural y el reconocimiento automático de voz. A través de SLU, Amazon Lex toma la entrada de voz y texto en lenguaje natural, comprende la intención y cumple la intención del usuario. Se puede crear un bot de Amazon Lex desde la consola o mediante API.

Beneficios

Los chatbots se pueden crear y probar directamente desde la consola de administración de AWS. Estos chatbots se pueden integrar fácilmente en Facebook Messenger, Slack y Twilio SMS a través de sus capacidades de formato enriquecido.
Los registros de conversaciones se pueden almacenar en Amazon CloudWatch para un análisis más detallado. Puede usarlos para monitorear su bot y obtener información para mejorar su experiencia de usuario.
Amazon Lex se puede integrar en otros servicios de AWS como Amazon Cognito, AWS Lambda, Amazon DynamoDB, Amazon CloudWatch y AWS Mobile Hub para aprovechar la seguridad de las aplicaciones, el monitoreo, la autenticación de usuarios, la lógica empresarial, el almacenamiento y el desarrollo de aplicaciones móviles en las plataformas AWS.
Los chatbots de Amazon Lex también se pueden integrar en sus aplicaciones web personalizadas. Solo necesita crear un widget de chatbot e integrarlo en su interfaz de usuario.

Buscar este blog

Publicaciones Roberto Martinez Gonzalez