• Cloudera Cloudera
  • Investigación de Fast Forward Labs ya disponible sin suscripción

    A partir de ahora, todos los informes nuevos estarán disponibles públicamente con descarga gratuita. Además, ofreceremos versiones actualizadas de informes más antiguos en el futuro, así que vuelva por aquí de vez en cuando para ver qué investigaciones gratuitas hay disponibles.

    Informes de investigación gratuitos

    Explore nuestros últimos informes y prototipos de investigación, disponibles de forma gratuita. 

    Transferencia del estilo del texto

    La tarea de procesamiento del lenguaje natural (NLP, por sus siglas en inglés) de transferencia del estilo del texto (TST) tiene como objetivo controlar automáticamente los atributos de estilo de un fragmento de texto conservando el contenido, lo cual es una consideración importante para que NLP se centre más en el usuario. En este report, exploramos la transferencia del estilo del texto a través de un caso de uso aplicado: neutralizar el sesgo de la subjetividad en el texto libre. Durante el proceso, describimos nuestro enfoque de modelado secuencia a secuencia aprovechando los transformadores faciales de HuggingFace y presentamos un conjunto de métricas de evaluación personalizadas y libres de referencia para cuantificar el rendimiento del modelo. Por último, concluimos con un debate sobre ética centrado en nuestro prototipo: Explorar la asistencia inteligente en la escritura.

    Leer el report
    Explorar el código

    Transferencia del estilo del texto

    Cómo inferir la deriva conceptual sin datos etiquetados

    La deriva conceptual se produce cuando las propiedades estadísticas de un dominio de destino cambian a lo largo del tiempo, dando lugar a una degradación del rendimiento del modelo. Normalmente, la detección de la deriva se consigue monitorizando una métrica de rendimiento de interés y activando un proceso de reentrenamiento cuando la métrica desciende por debajo de un umbral designado. Sin embargo, este enfoque asume que hay una abundancia de datos etiquetados disponibles en el momento de la predicción, una restricción poco realista para muchos sistemas de producción. En este informe exploramos varios enfoques para tratar la deriva conceptual cuando no se puede acceder con facilidad a datos etiquetados.

    Lea el report
    Explore el código

     Cómo inferir la deriva conceptual sin datos etiquetados

    Explorar la optimización de hiperparámetros multiobjetivo

    Desarrollamos modelos de aprendizaje automático en contraste con las métricas habituales, como la exactitud predictiva, el recuerdo y la precisión. Sin embargo, estas métricas no son realmente lo único que nos importa. Los modelos de producción también deben satisfacer los requisitos físicos, como la latencia o el espacio de memoria, o las restricciones de equidad. La optimización de hiperparámetros es aún más complicada cuando tenemos varias métricas que optimizar. Nuestras últimas investigaciones examinan en detalle este escenario de optimización de hiperparámetros “multiobjetivo”.

    Lea el report
    Explore el código

    Explorar la optimización de hiperparámetros multiobjetivo

    Aprendizaje profundo para la verificación automática de firmas fuera de línea

    La verificación de firmas manuscritas tiene como objetivo discriminar automáticamente entre las firmas auténticas y las falsificadas, y es un reto especialmente importante debido a la ubicuidad de las firmas manuscritas como forma de identificación en los ámbitos legal, financiero y administrativo. Este ciclo de investigación ha explorado el uso de enfoques de aprendizaje profundo de métricas, específicamente las redes siamesas, combinadas con nuevos métodos de extracción de características para mejorar las técnicas tradicionales.

    Lea el report
    Explore el código

    Clasificación de texto con datos escasos

    Sistemas de recomendación basados en sesiones

    Los sistemas de recomendación se han convertido en una piedra angular de la vida moderna, abarcando sectores que incluyen la venta minorista en línea, la transmisión de música y vídeo, e incluso la publicación de contenidos. Estos sistemas nos ayudan a navegar por el enorme volumen de contenidos de internet, lo que nos permite descubrir lo que es interesante o importante para nosotros. Una tendencia esencial en los últimos años han sido los algoritmos de recomendación basados en sesiones que proporcionan recomendaciones basadas únicamente en las interacciones de un usuario en una sesión en curso, y que no requieren de la existencia de perfiles de usuario o de todas sus preferencias históricas.

    Lea el report
    Explore el código

    Clasificación de texto con datos escasos

    Clasificación de texto con datos escasos

    La clasificación de textos puede emplearse para el análisis de opiniones, asignación de temas, identificación de documentos, recomendación de artículos y más. Hoy en día existen docenas de técnicas para esta tarea fundamental, pero muchas de ellas requieren cantidades masivas de datos etiquetados para ser útiles. Normalmente, recopilar anotaciones para su caso de uso es una de las partes más costosas de cualquier aplicación de aprendizaje automático. En este informe exploramos cómo pueden utilizarse las integraciones de texto latente con pocos modelos de entrenamiento (o incluso ninguno) y ofreceremos información sobre las mejores prácticas para implementar este método.

    Lea el report
    Explore el código

    Clasificación de texto con datos escasos

    Series temporales estructuradas

    Los datos de series temporales están en todas partes. Este informe analiza los modelos aditivos generales, que nos dan una forma sencilla, flexible e interpretable de modelar series temporales desglosándolas en sus componentes estructurales. Veremos los beneficios y compensaciones de adoptar un enfoque de serie temporal ajustado a la curva y mostraremos cómo se usa a través de la biblioteca de Prophet de Facebook con un problema de previsión de la demanda.

    Lea el report
    Explore el código

    Metaaprendizaje

    A diferencia de la manera de aprender de los humanos, los algoritmos de aprendizaje profundo necesitan grandes cantidades de datos y computación, y aún así pueden tener dificultades para generalizar. Los humanos son capaces de adaptarse rápidamente porque, cuando se enfrentan a problemas nuevos, aprovechan los conocimientos adquiridos a partir de la experiencia previa. En este informe explicamos cómo el metaaprendizaje puede aprovechar los conocimientos previos adquiridos a partir de los datos para resolver tareas novedosas de manera rápida y más eficiente durante el periodo de pruebas.

    Lea el report
    Explore el código

    Respuesta automatizada de preguntas

    La respuesta automatizada de preguntas es un procedimiento fácil de usar para extraer información a partir de datos mediante el uso de lenguaje natural. Gracias a recientes avances en el procesamiento de lenguaje natural, las capacidades de responder a preguntas a partir de datos de texto no estructurados se han incrementado con rapidez. Esta serie de publicaciones en el blog ofrece un recorrido en el que se detallan los aspectos técnicos y prácticos de la construcción de un sistema integral para dar respuesta a preguntas.

    Lea la serie de publicaciones de blog interactivas

    Causalidad para el machine learning

    La intersección de la inferencia causal y el aprendizaje automático es un área de investigación en rápida expansión, que ya está dando resultados en capacidades para la construcción de sistemas de machine learning más sólidos, fiables y justos. En este informe se ofrece una introducción al razonamiento causal incluyendo gráficos causales y predicción invariante, y cómo aplicar las herramientas de inferencia causal junto con técnicas de machine learning clásicas en diversos casos de uso.

    Leer el report
    Explorar el prototipo

    Interpretabilidad: edición de 2020

    La interpretabilidad es la capacidad de explicar por qué y cómo toma una decisión un sistema, y puede ayudarnos a mejorar modelos, cumplir con regulaciones y crear productos mejores. Las técnicas de sistemas opacos como el aprendizaje profundo han logrado grandes avances en cuanto a capacidades, pero a costa de la interpretabilidad. En este informe, actualizado recientemente para incluir técnicas como la SHAP, se muestra cómo hacer modelos interpretables sin renunciar a su funcionalidad ni a su exactitud.

    Leer informe

    Aprendizaje profundo para la detección de anomalías

    Desde la detección de fraudes hasta los avisos de anomalía en datos de imagen, hay innumerables aplicaciones para la identificación automática de datos anómalos. Este proceso puede resultar difícil, en especial cuando se trabaja con cantidades de datos mayores y más complejas. Este informe explora enfoques del aprendizaje profundo (modelos de secuencia, VAE, GAN) para la detección de anomalías, cuándo usarlos, los puntos de referencia en rendimiento y las posibilidades del producto.

    Leer el report
    Explorar el prototipo

    Fast Forward Labs: Aprendizaje profundo para análisis de imágenes (edición de 2019)

    Aprendizaje por transferencia para el procesamiento del lenguaje natural

    Las tecnologías de procesamiento del lenguaje natural (NLP, por sus siglas en inglés) que utilizan el aprendizaje profundo pueden traducir un idioma, responder a preguntas y redactar texto como una persona. Pero estas técnicas de aprendizaje profundo requieren grandes y costosos conjuntos de datos etiquetados, una gran infraestructura y una experiencia que escasea. El aprendizaje por transferencia elimina estas limitaciones al reutilizar y adaptar la comprensión del idioma de un modelo. El aprendizaje por transferencia es una buena opción para cualquier aplicación de NLP. En este report, mostramos cómo utilizar el aprendizaje por transferencia para crear sistemas de NLP de alto rendimiento con los mínimos recursos.

    Leer informe

    Report Aprendizaje por transferencia para NLP de Fast Forward Labs

    Aprendizaje con datos etiquetados limitados

     Ser capaz de empezar a aprender con datos etiquetados limitados suaviza el estricto requisito de datos etiquetados para el aprendizaje automático supervisado. Este report se centra en el aprendizaje activo, una técnica que se basa en la colaboración entre máquinas y humanos para etiquetar de manera inteligente. El aprendizaje activo reduce el número de ejemplos etiquetados necesarios para entrenar un modelo, lo que ahorra tiempo y dinero al tiempo que obtiene un rendimiento comparable a los modelos entrenados con muchos más datos. Con el aprendizaje activo, las empresas pueden aprovechar su gran conjunto de datos sin etiquetar para abrirse a nuevas posibilidades de productos.

    Leer el report
    Explorar el prototipo

    Fast Forward Labs: aprendizaje con datos etiquetados limitados

    Aprendizaje federado

    El aprendizaje federado hace posible crear sistemas de aprendizaje automático sin acceso directo a los datos de formación. Los datos permanecen en su ubicación original, lo que ayuda a garantizar la privacidad y reduce los costes de comunicación. El aprendizaje federado es muy adecuado para smartphones, hardware en el edge, asistencia sanitaria y otros casos de uso en los que la privacidad es esencial, así como aplicaciones industriales como el mantenimiento predictivo.

    Leer el report
    Explorar el prototipo

    Fast Forward Labs: Aprendizaje profundo para análisis de imágenes (edición de 2019)

    Recomendaciones semánticas

    Internet nos ha dado una avalancha de opciones para leer, ver y comprar. Por ello, los algoritmos de recomendación, que encuentran elementos que le interesarán a una persona en particular, son más importantes que nunca. En este report, exploramos los sistemas de recomendación que hacen uso del contenido semántico de los elementos y los usuarios para ofrecer recomendaciones más ricas en varios sectores.

    Leer informe

    Recomendaciones semánticas

    Resumen

    Este informe analiza métodos de resumen extractivo, una funcionalidad que permite resumir documentos de manera automática. Esta técnica tiene multitud de aplicaciones, como sintetizar miles de reseñas de productos, extraer el contenido más importante de artículos de noticias largos o agrupar automáticamente perfiles de cliente.

    Leer informe

    Fast Forward Labs: Aprendizaje profundo para análisis de imágenes (edición de 2019)

    Aprendizaje profundo para análisis de imágenes (edición de 2019)

    Las redes neuronales convolucionales (CNN, por sus siglas en inglés, o ConvNet) ofrecen resultados extraordinarios en el aprendizaje de representaciones significativas de características y conceptos en las imágenes. Por ello son muy valiosas para la resolución de problemas en múltiples ámbitos, como el diagnóstico por imágenes y la fabricación. En este report, mostramos cómo seleccionar los modelos de aprendizaje profundo adecuados para tareas y técnicas de análisis de imágenes que permitan perfeccionar los modelos de aprendizaje profundo.

    Leer el report
    Explorar el prototipo

    Fast Forward Labs: Aprendizaje profundo para análisis de imágenes (edición de 2019)

    Aprendizaje profundo: análisis de imágenes

    Este informe explora la historia y el estado actual del aprendizaje profundo, explica cómo aplicarlo y predice futuros avances.

    Leer informe

    Métodos probabilísticos para transmisiones en tiempo real

    Desde los días de los ordenadores analógicos construidos sobre levas y engranajes, hemos estado diseñando sistemas en torno al flujo de datos y los cálculos críticos que debemos realizar. Aunque la filosofía de nuestros diseños ha persistido, nuestras limitaciones de ingeniería están en constante evolución. En los últimos cinco años, hemos sido testigos de la aparición de “big data”, o la capacidad de usar la infraestructura de los productos básicos para analizar grandes conjuntos de datos en un mismo lote. Actualmente estamos en medio de un gran avance con respecto a las herramientas, los métodos y las tecnologías disponibles para trabajar con transmisiones de datos en tiempo real.

    Leer informe

    Informes solo con suscripción

    Habrá versiones actualizadas gratuitas de informes más antiguos disponibles en el futuro, así que vuelva por aquí de vez en cuando.

    Imagen de informe y prototipo de aprendizaje multitarea

    Aprendizaje multitarea

    En este informe centramos nuestra atención en el aprendizaje multitarea, un nuevo enfoque al aprendizaje automático que permite a los algoritmos realizar tareas en paralelo.

    Programación probabilística

    Aquí mostramos cómo usar la programación probabilística y la inferencia bayesiana para crear fácilmente herramientas que realicen predicciones más acertadas con el fin de mejorar la eficiencia de la toma de decisiones.

    Generación de lenguaje natural

    En este informe analizamos cómo los sistemas automatizados pueden convertir datos altamente estructurados en discurso articulado propio del lenguaje humano.

    Lee el blog de Fast Forward Labs

     

    Ve un paso por delante

    Inscríbete para recibir nuestro boletín electrónico mensual y estar informado de los últimos avances en inteligencia artificial aplicada, así como de las novedades y los eventos de la empresa.

     

    Ponte en contacto con nosotros para informarte sobre la suscripción a la investigación

    Your form submission has failed.

    This may have been caused by one of the following:

    • Your request timed out
    • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.