Rendered.ai presenta una plataforma como servicio para crear datos sintéticos para entrenar modelos de IA
A medida que más organizaciones recurren a los datos sintéticos para alimentar sus algoritmos de aprendizaje automático hambrientos de datos, Rendered.ai quiere ayudar.
A medida que la llegada del aprendizaje automático continúa alterando una franja de industrias, una de las cosas que se está volviendo cada vez más clara es que el aprendizaje automático necesita muchos datos de alta calidad para funcionar bien.
De acuerdo con los resultados de una encuesta publicada recientemente, el 99% de los encuestados informaron haber tenido un proyecto de ML completamente cancelado debido a datos de capacitación insuficientes, y el 100% de los encuestados informaron haber experimentado retrasos en el proyecto como resultado de datos de capacitación insuficientes.
El uso de datos sintéticos es un enfoque para sortear los problemas asociados con la obtención y el uso de datos de alta calidad del mundo real. Hoy Rendered.ai ha anunciado la disponibilidad de su oferta de plataforma como servicio para ingenieros de datos sintéticos y científicos de visión artificial.
Rendered.ai promociona su plataforma como la primera de su tipo, y una pila completa para datos sintéticos que incluye un entorno de desarrollador, un sistema de gestión de contenidos, creación de escenarios, orquestación informática, herramientas de posprocesamiento y más.
Nos reunimos con Rendered.ai fundador y director ejecutivo, Nathan Kundtz, para obtener más información sobre los casos de uso que puede servir la plataforma y cómo funciona bajo el capó.
Los datos de calidad para los modelos de IA son difíciles de conseguir y caros
Kundtz, físico de formación, tiene un doctorado de la Universidad de Duke. También tiene experiencia previa en startups, ya que fundó y entregó con éxito Kymeta. Kymeta es un desarrollador de redes híbridas satelitales-celulares, y Kundtz no dejaba de oír hablar de los desafíos que la gente de la industria satelital tenía con los datos.
Expresó sus ideas sobre cómo abordar esos desafíos en un documento técnico, que compartió con algunas personas. Algunas de estas personas decidieron trabajar con él, tratando de construir herramientas que pudieran ayudar a las personas en la industria satelital, particularmente en la teledetección. Eso llevó a comenzar Rendered.ai en 2019.
Kundtz se refirió a la teledetección como imágenes de "ciudades que se construyen, patrones de vida, cultivos, silvicultura, etc. desde el espacio". Eso entra de lleno en la categoría de datos visuales no estructurados. Pero eso no es todo lo Rendered.ai puede producir.
Los datos visuales pueden referirse al tipo de imágenes que provienen de las cámaras, pero también pueden referirse a cosas como los rayos X. Rendered.ai también hace radar y muchas otras modalidades de detección diferentes que, en última instancia, se pueden traducir utilizando herramientas de visión por computadora. La plataforma también se puede utilizar para datos no visuales, como datos tabulares, datos de audio o datos de vídeo.
Kundtz destacó un caso de uso en el que Orbital Insight trabajó con Rendered.ai como parte de una subvención de Investigación de Innovación en Pequeñas Empresas de la Agencia Nacional de Inteligencia Geoespacial. Orbital Insight demostró resultados mejorados para el rendimiento de la detección de objetos mediante el uso de datos sintéticos.
Rendered.ai les ayudó a modificar imágenes sintéticas, de modo que el modelo de IA entrenado pueda generalizar a imágenes reales. También ayudaron a usar la combinación de un gran conjunto de imágenes sintéticas y un pequeño conjunto de ejemplos reales de manera eficiente para entrenar conjuntamente un modelo.
Como señaló Kundtz, para hacer que las imágenes sean relevantes para la visión por computadora, se necesita más que las imágenes en sí mismas. Las imágenes deben estar anotadas para etiquetar correctamente los elementos representados que deben ser identificados por los modelos de IA.
Anotar una franja de 200 kilómetros en fotogrametría RGB puede costar más de 65.000 dólares, dijo Kundtz. Y eso no incluye necesariamente todos los objetos que a las personas que patrocinan la anotación les gustaría entrenar modelos de IA para identificar. La idea detrás de los datos sintéticos es generar datos que sean lo suficientemente realistas, pero que al mismo tiempo estén garantizados para incluir todo lo que el modelo de IA necesita aprender, y vienen preanotados, lo que reduce el costo.
Aproximación al mundo real
Rendered.ai aplica lo que denomina un enfoque basado en la física. Lo que esto significa en la práctica, como explicó Kundtz, es que aplican simulaciones basadas en la física para aproximarse al comportamiento en el mundo real lo suficientemente bien como para generar datos útiles. Hay otras formas de generar datos sintéticos, pero Kundtz cree que ninguna de ellas funciona tan bien.
Las GAN (Generative Adversarial Networks) son un método común utilizado para generar datos sintéticos. Esencialmente, proporcionamos una gran cantidad de imágenes y luego enseñamos a un algoritmo a hacer más parecidas a lo que ya tenemos, como dijo Kundtz. El problema con las GAN, agregó, es que no estás introduciendo ninguna información nueva. Produces hacer de lo que ya tienes.
Otro método para producir datos sintéticos es el uso de motores de videojuegos. Hay mucha física en eso, y Rendered.ai también los usa, admitió Kundtz, pero tiene un alcance bastante limitado. Cree que este enfoque no se presta a la amplia gama de casos de uso para los que las personas necesitan datos sintéticos. Además, los motores de juegos no están en el punto en el que son indistinguibles de la realidad y, a veces, eso puede tener un efecto importante en los algoritmos.
Lo Rendered.ai ha hecho, dijo Kundtz, es hacer que su plataforma sea extensible a una amplia variedad de diferentes tipos de simulación, y luego construir asociaciones con las empresas que tienen una profunda experiencia en esas áreas. No solo trabajando con los códigos de los motores de los videojuegos, sino incorporando conocimientos profundos de física.
Los datos sintéticos pueden ser útiles para alimentar algoritmos de aprendizaje automático. Imagen: Rendered.ai
En cualquier caso, no se trata de simular el mundo real, sino de simular la malla que puedes crear del mundo real. Por definición, la simulación no va a capturar el 100% de la fidelidad del mundo real. Esto significa que hay que hacer dos cosas, anotó Kundtz.
El primero es superar las brechas con respecto a la realidad, para evitar introducir artefactos que puedan confundir a los modelos de IA. La segunda es aplicar efectos de post-procesado, para ayudar a superar el llamado valle inquietante y mejorar el realismo.
La plataforma de Rendered.ai tiene dos componentes principales: un marco de desarrollo y un entorno de biblioteconomía de orquestación informática. "Cualquier cosa que puedas programar con Python, puedes ponerla en ese marco de desarrollo", como dijo Kundtz. También hay una capa visual, un entorno sin código como lo llama Rendered.ai, que permite a las personas generar flujos de trabajo sin tener que escribir todo manualmente.
Pero el corazón del enfoque radica en lo que Rendered.ai llama "el gráfico". Esta es una forma visual de definir diferentes tipos de objetos, sus propiedades e interdependencias:
"El grafo no solo define un dato, una imagen o una tabla, sino un enfoque estocástico para generarlos. Por lo tanto, se puede usar ese gráfico para generar continuamente datos adicionales dentro de algún dominio", dijo Kundtz.
En este contexto, Rendered.ai define las funciones del ingeniero de datos sintéticos y del ingeniero de visión artificial. El ingeniero de datos sintéticos es la persona que escribe scripts que definen lo que va a ser posible a partir de diferentes grafos. El ingeniero de visión artificial ingiere gráficos y determina cuáles son las cosas que quiere ver en un conjunto de datos determinado.
Plataforma colaborativa, computación incluida
Kundtz también elaboró sobre el proceso y las herramientas utilizadas para introducir una cierta cantidad de aleatoriedad cuando fuera necesario. Esto puede ser útil para garantizar que los datos reflejen el mundo real, y también para generar casos extremos y probar diferentes escenarios.
Rendered.ai afirma que parte de la innovación que introduce su plataforma es precisamente la definición de esos diferentes roles en el proceso, junto con la infraestructura de colaboración para soportarlos. La mayoría de las herramientas de simulación y las herramientas de modelado 3D y de juegos se construyen en torno a un solo usuario, pero los datos sintéticos son fundamentalmente multidisciplinarios, dijo Kundtz.
El proceso de incorporación de Rendered.ai suele partir del código existente, que luego se modifica para adaptarse a las necesidades de cada cliente. Kundtz reconoció que aún es temprano para los datos sintéticos, por lo que educar a los clientes y ayudarlos a experimentar es parte integral de la misión de Rendered.ai.
Lo que ayuda en ese sentido es el hecho de que obtener un plan Developer o Professional, por $500/mes y $5000/mes respectivamente, viene incluido con la computación en AWS. Aunque existen algunas restricciones en las instancias, la idea es permitir a los usuarios ejecutar los experimentos que necesitan sin preocuparse demasiado por su factura de AWS. También hay un nivel gratuito disponible para probar la plataforma.
Rendered.ai, que recibió 6 millones de dólares en financiación inicial en 2021, ya ha lanzado una aplicación de código abierto y contenido relacionado para ayudar a los usuarios a incorporarse a su plataforma. Kundtz mencionó que lanzarán aplicaciones y contenido de código abierto adicionales para más dominios, en un esfuerzo por incorporar a más usuarios.
"Podemos hacer mucho para ayudar a la gente en esta industria. Y creo que este es uno de los problemas más importantes a los que se enfrenta la IA, si no el más importante. Así que estoy emocionado de poder ayudar", concluyó.
Nota: El artículo se actualizó el 4 de febrero de 2022 para corregir Rendered.ai fecha de la ronda de financiación y los nombres de sus niveles de suscripción, que anteriormente se informaron erróneamente.