Servicios Cognitivos de Azure

Visión
1. algoritmos de procesamiento de imágenes
  1. identifican, subtitulan, indexan y moderan
    1. imágenes y vídeos
2. API's
  1. Computer Vision
    1. da acceso a algoritmos avanzados
      1. procesan imágenes y devuelven información
    2. Extracción de texto en las imágenes
      1. reconocimiento óptico de caracteres (OCR)
    3. Requisitos de imagen
      1. Formatos
        JEPG
        PNG
        GIF
        BMP
      2. Tamaño
        inferior a 4 megabytes (MB)
      3. Dimensiones
        mayores que 50 x 50 píxeles
        para OCR, entre 50 x 50 y 4200 x 4200 píxeles
  2. Video Indexer
    1. extrae información de los vídeos
      1. mediante modelos de vídeo y audio
    2. Vídeo
      1. Detección de caras
      2. Identificación de celebridades
      3. Identificación facial basada en cuentas
      4. Extracción de miniaturas de caras ("mejor cara")
      5. Reconocimiento de texto visual (OCR), etc.
    3. Audio
      1. Detección de idioma automática
      2. Transcripción de audio
      3. Subtítulos (CC)
      4. Personalización de la transcripción (CRIS)
      5. Detección de emociones, etc.
    4. Escenarios
      1. Búsqueda
      2. Creación de contenido
      3. Monetización
      4. Involucración del usuario
  3. Custom Vision
    1. permite crear, implementar
      1. y mejorar clasificadores de imágenes propios
    2. usa un algoritmo de aprendizaje automático
      1. para aplicar etiquetas a las imágenes
        Clasificación y detección de objetos
  4. Face
    1. algoritmos para detectar, reconocer
      1. y analizar caras humanas en imágenes
    2. Detección de Caras
      1. puede detectar caras humanas en una imagen
        devuelve coordenadas del rectángulo de sus ubicaciones
      2. Extrae una serie de atributos faciales
        postura
        posición de la cabeza
        género
        edad
        emociones
    3. Verificación de caras
      1. autenticación con dos caras detectadas
        o desde una cara detectada en un objeto personal
    4. Búsqueda de caras similares
      1. toma una cara objetivo y una serie de caras candidatas
        busca un conjunto pequeño de las caras que más se asemejan a la cara objetivo
3. Versión Preliminar
  1. Ink Recognizer
    1. analiza y reconoce contenido de tinta digital
      1. los trazos de tinta digital son conjuntos ordenados
        en el tiempo de puntos 2D
        representan el movimiento de las herramientas de entrada
  2. Form Recognizer
    1. identifica y extrae pares de valores clave y datos
      1. de tablas de documentos de formularios
        genera datos estructurados
        que incluyen las relaciones en el archivo original
Toma de Decisiones
1. API's
  1. Content Moderator
    1. comprueba el contenido de texto, imágenes
      1. y vídeo de material que es potencialmente ofensivo, arriesgado
        o no deseable por algún otro motivo
        Donde se usa
        Instancias de Marketplace en línea
        Empresas de juegos
        Plataformas de mensajería de las redes sociales
        Empresas multimedia
        Proveedores de soluciones educativas de tipo K-12
  2. Versión Preliminar
    1. Anomaly Detector
      1. permite controlar y detectar anomalías
        en los datos de sus series de tiempo
        con el aprendizaje automático
      2. Características
        Detectar anomalías a medida que se producen en tiempo real
        Detectar anomalías a lo largo de un conjunto de datos como un lote
        Obtener información adicional sobre los datos
        Ajustar los límites de detección de anomalías
    2. Personalizer
      1. descubrir qué acción usar en un contexto
      2. Ciclo de Aprendizaje
        tiene un modelo que se entrena exclusivamente con los datos que le ha enviado
        a través de las llamadas de Rango y Recompensa
        cada ciclo es completamente independiente el uno del otro
      3. Arquitectura
        Utiliza un modelo interno de AI para determinar el rango de la acción
        El servicio decide si explotar el modelo actual
        o explorar nuevas opciones
        El resultado del ranking se envía a EventHub
        Personalizer recibe la recompensa, la recompensa se envía a EventHub
        El rango y la recompensa están correlacionados
        El modelo de AI se actualiza en base a los resultados de correlación
        El motor de inferencia se actualiza
        con el nuevo modelo
Idioma
1. Permitir que las aplicaciones procesen lenguaje natural con scripts precompilados
  1. evalúen los sentimientos
  2. aprendan a reconocer lo que los usuarios desean
2. API's
  1. Text Analytics
    1. proporciona un procesamiento avanzado de idioma natural
      1. sobre texto sin formato
        Funciones
        Análisis de Sentimiento
        averiguar qué piensan los clientes de una marca o de un tema concreto
        mediante análisis de texto sin formato
        el fin es obtener pistas acerca de
        si sus opiniones son positivas o negativas
        Extracción de Frases cLave
        identificar rápidamente los puntos principales
        Detección de Idiomas
        detectar en qué idioma está escrito el texto de entrada
        utilizar un código de idioma único para informar
        cada documento enviado en la solicitud
        para un máximo de 120 idiomas
        Reconocimiento de entidades con nombre
        Identificar y clasificar las entidades en el texto
        como personas, lugares, organizaciones, fecha y hora, cantidades, porcentajes, etc.
        las más conocidas también se reconocen
        vinculan a más información en la web
  2. Translator Text
    1. Permite agregar experiencias de usuario multilingüe
      1. en más de 60 idiomas
        se puede usar en cualquier plataforma de hardware
        con cualquier sistema operativo
        para traducción de texto a texto
  3. Bing Spell Check
    1. realizar gramática contextual
      1. y ortografía en el texto
        aprovecha el aprendizaje automático
        y la traducción automática estadística
        para proporcionar correcciones precisas y contextuales
  4. QnA Maker
    1. crea una capa de conversación, preguntas
      1. y respuestas mediante los datos
        Procesos Principales
        Extracción
        los datos de preguntas y respuestas estructurados
        se extraen de orígenes de datos
        estructurados y semiestructurados
        como preguntas frecuentes y manuales de producto
        Coincidencia
        la base de conocimientos se ha entrenado y probado
        se publica y habilita un punto de conexión a la base de conocimiento
        puede usar en un bot o aplicación cliente
        acepta una pregunta del usuario y responde con la mejor respuesta
Voz
1. Convertir voz en texto
  1. usar la voz con fines de comprobación
    1. agregar reconocimiento del hablante a sus aplicaciones
2. API's
  1. Servicios de Voz
    1. unificación de
      1. voz a texto
        transcribe secuencias de audio
        a texto en tiempo real
        que las aplicaciones, herramientas o dispositivos
        pueden usar o mostrar
      2. texto a voz
        convierte el texto de entrada en voz sintetizada
        similar a la humana
        Elegida entre voces estándar y voces neuronales
      3. traducción de voz
        habilita la traducción de voz
        en varios idiomas en tiempo real
        en sus aplicaciones, herramientas y dispositivos
  2. Versión Preliminar
    1. Speaker Recognition
      1. algoritmos más avanzados para comprobación
        e identificación del hablante
      2. Categorías
        Verificación de Hablante
        se puede usar para identificar a una persona
        de manera similar a una huella digital
        Comprobación
        Identificación del Hablante
        identificar automáticamente a la persona que habla
        en un archivo de audio dentro de un grupo de posibles hablantes
        Reconocimiento
Búsqueda
1. Agregar Bing Search APIs a las aplicaciones
  1. aprovechar la capacidad de buscar en miles de millones de páginas web
    1. imágenes, vídeos y noticias con una sola llamada API
      1. API's
        Bing Web Search
        Bing Visual Search
        Bing Custom Search
        Bing Entity Search
        Bing Video Search
        Bing News Search
        Bing Image Search
        Bing Autosuggest
        Versión Preliminar
        Bing Local Business Search

Nächster

Servicios Cognitivos de Azure

Beschreibung

Zusammenfassung der Ressource

Medienanhänge

ähnlicher Inhalt

	Erstellt von Andres Paul Lopez Garcia vor mehr als 5 Jahre