Zusammenfassung der Ressource
Servicios Cognitivos
de Azure
- Visión
- algoritmos de
procesamiento de
imágenes
- identifican,
subtitulan, indexan
y moderan
- imágenes y vídeos
- API's
- Computer Vision
- da acceso a
algoritmos avanzados
- procesan imágenes y
devuelven información
- Extracción de texto
en las imágenes
- reconocimiento óptico
de caracteres (OCR)
- Requisitos de imagen
- Formatos
- JEPG
- PNG
- GIF
- BMP
- Tamaño
- inferior a 4
megabytes (MB)
- Dimensiones
- mayores que
50 x 50 píxeles
- para OCR, entre 50 x 50 y
4200 x 4200 píxeles
- Video Indexer
- extrae información de los
vídeos
- mediante modelos de
vídeo y audio
- Vídeo
- Detección de caras
- Identificación de celebridades
- Identificación facial basada en cuentas
- Extracción de miniaturas de caras ("mejor cara")
- Reconocimiento de texto visual (OCR), etc.
- Audio
- Detección de idioma automática
- Transcripción de audio
- Subtítulos (CC)
- Personalización de la transcripción (CRIS)
- Detección de emociones, etc.
- Escenarios
- Búsqueda
- Creación de contenido
- Monetización
- Involucración del usuario
- Custom Vision
- permite crear,
implementar
- y mejorar clasificadores de
imágenes propios
- usa un algoritmo de
aprendizaje automático
- para aplicar etiquetas a las imágenes
- Clasificación y detección de objetos
- Face
- algoritmos para
detectar, reconocer
- y analizar caras
humanas en imágenes
- Detección de Caras
- puede detectar caras
humanas en una imagen
- devuelve coordenadas del
rectángulo de sus ubicaciones
- Extrae una serie de
atributos faciales
- postura
- posición de la cabeza
- género
- edad
- emociones
- Verificación de caras
- autenticación con dos
caras detectadas
- o desde una cara detectada en
un objeto personal
- Búsqueda de
caras similares
- toma una cara objetivo y una
serie de caras candidatas
- busca un conjunto pequeño de las caras
que más se asemejan a la cara objetivo
- Versión Preliminar
- Ink Recognizer
- analiza y reconoce
contenido de tinta digital
- los trazos de tinta digital
son conjuntos ordenados
- en el tiempo de puntos 2D
- representan el movimiento de las
herramientas de entrada
- Form Recognizer
- identifica y extrae pares de
valores clave y datos
- de tablas de documentos
de formularios
- genera datos estructurados
- que incluyen las relaciones
en el archivo original
- Toma de Decisiones
- API's
- Content Moderator
- comprueba el contenido de
texto, imágenes
- y vídeo de material que es
potencialmente ofensivo,
arriesgado
- o no deseable por algún otro motivo
- Donde se usa
- Instancias de Marketplace en línea
- Empresas de juegos
- Plataformas de mensajería de las redes sociales
- Empresas multimedia
- Proveedores de soluciones
educativas de tipo K-12
- Versión Preliminar
- Anomaly Detector
- permite controlar y detectar anomalías
- en los datos de sus series de tiempo
- con el aprendizaje automático
- Características
- Detectar anomalías a medida que se producen en tiempo real
- Detectar anomalías a lo largo de un conjunto de datos como un lote
- Obtener información adicional sobre los datos
- Ajustar los límites de detección de anomalías
- Personalizer
- descubrir qué acción usar en un contexto
- Ciclo de Aprendizaje
- tiene un modelo que se entrena exclusivamente con los datos
que le ha enviado
- a través de las llamadas de Rango y Recompensa
- cada ciclo es completamente independiente el uno del otro
- Arquitectura
- Utiliza un modelo interno de AI para determinar el rango de la acción
- El servicio decide si explotar el modelo actual
- o explorar nuevas opciones
- El resultado del ranking se envía a EventHub
- Personalizer recibe la recompensa, la
recompensa se envía a EventHub
- El rango y la recompensa están correlacionados
- El modelo de AI se actualiza en base a los resultados de correlación
- El motor de inferencia se actualiza
- con el nuevo modelo
- Idioma
- Permitir que las aplicaciones procesen
lenguaje natural con scripts precompilados
- evalúen los sentimientos
- aprendan a reconocer lo que
los usuarios desean
- API's
- Text Analytics
- proporciona un procesamiento
avanzado de idioma natural
- sobre texto sin formato
- Funciones
- Análisis de Sentimiento
- averiguar qué piensan los clientes de una marca o de un tema concreto
- mediante análisis de texto sin formato
- el fin es obtener pistas acerca de
- si sus opiniones son positivas o negativas
- Extracción de Frases cLave
- identificar rápidamente los puntos principales
- Detección de Idiomas
- detectar en qué idioma está escrito el texto de entrada
- utilizar un código de idioma único para informar
- cada documento enviado en la solicitud
- para un máximo de 120 idiomas
- Reconocimiento de
entidades con nombre
- Identificar y clasificar las entidades en el texto
- como personas, lugares, organizaciones, fecha y hora, cantidades, porcentajes, etc.
- las más conocidas también se reconocen
- vinculan a más información en la web
- Translator Text
- Permite agregar experiencias
de usuario multilingüe
- en más de 60 idiomas
- se puede usar en cualquier
plataforma de hardware
- con cualquier sistema operativo
- para traducción de texto a texto
- Bing Spell Check
- realizar gramática contextual
- y ortografía en el texto
- aprovecha el aprendizaje automático
- y la traducción automática estadística
- para proporcionar correcciones precisas y contextuales
- QnA Maker
- crea una capa de conversación, preguntas
- y respuestas mediante los datos
- Procesos Principales
- Extracción
- los datos de preguntas y respuestas estructurados
- se extraen de orígenes de datos
- estructurados y semiestructurados
- como preguntas frecuentes y manuales de producto
- Coincidencia
- la base de conocimientos se ha entrenado y probado
- se publica y habilita un punto de conexión a la base de conocimiento
- puede usar en un bot o aplicación cliente
- acepta una pregunta del usuario y responde con la mejor respuesta
- Voz
- Convertir voz en texto
- usar la voz con fines de
comprobación
- agregar reconocimiento del
hablante a sus aplicaciones
- API's
- Servicios de Voz
- unificación de
- voz a texto
- transcribe secuencias de audio
- a texto en tiempo real
- que las aplicaciones, herramientas o
dispositivos
- pueden usar o mostrar
- texto a voz
- convierte el texto de entrada
en voz sintetizada
- similar a la humana
- Elegida entre voces estándar y
voces neuronales
- traducción de
voz
- habilita la traducción
de voz
- en varios idiomas en
tiempo real
- en sus aplicaciones,
herramientas y dispositivos
- Versión Preliminar
- Speaker Recognition
- algoritmos más avanzados para
comprobación
- e identificación del
hablante
- Categorías
- Verificación de
Hablante
- se puede usar para
identificar a una persona
- de manera similar a una huella digital
- Comprobación
- Identificación del
Hablante
- identificar automáticamente a la
persona que habla
- en un archivo de audio dentro de
un grupo de posibles hablantes
- Reconocimiento
- Búsqueda
- Agregar Bing Search APIs a
las aplicaciones
- aprovechar la capacidad de buscar en miles de
millones de páginas web
- imágenes, vídeos y noticias con una
sola llamada API
- API's
- Bing Web Search
- Bing Visual Search
- Bing Custom Search
- Bing Entity Search
- Bing Video Search
- Bing News Search
- Bing Image Search
- Bing Autosuggest
- Versión Preliminar
- Bing Local Business Search