Búsqueda de sitios web

¿Podría la IA convertirte en multimillonario en 2025?


Hydrogen Torch, el último producto de H2O, está diseñado para ofrecer las capacidades de IA de los gigantes de la web al resto del mundo, dice el CEO Sri Ambati.

Hay alrededor de 1200 grandes maestros de ajedrez en el mundo y solo 250 grandes maestros de IA. En el ajedrez, como en la IA, gran maestro es un galardón reservado para el nivel más alto de los jugadores profesionales. En IA, este galardón se otorga a los científicos de datos de mayor rendimiento en el sistema de progresión de Kaggle.

H2O.ai, la empresa de IA Cloud que recaudó 100 millones de dólares en una ronda de Serie E a finales de 2021, y que ahora está valorada en 1.600 millones de dólares, emplea al 10% de los grandes maestros de la IA del mundo. La compañía acaba de anunciar H2O Hydrogen Torch, un producto que tiene como objetivo llevar el gran dominio de la IA para el procesamiento de imágenes, video y lenguaje natural (NLP) a la empresa.

Nos pusimos en contacto con el CEO y fundador de H2O, Sri Ambati, y discutimos todo, desde los orígenes de H2O y la oferta general hasta Hydrogen Torch y dónde encaja en el panorama de la IA.

H2O: Una pila para la IA

Ambati comenzó a trabajar con IA haciendo traducción de voz a texto para el programa de investigación espacial indio hace algunas décadas. Posteriormente, se topó con las redes neuronales, que se encontraban en una etapa temprana en ese momento. Como inmigrante en Silicon Valley, pasó un tiempo trabajando en startups. También pasó tiempo sabático entre Berkeley y Stanford y conoció a matemáticos, físicos e informáticos.

Trabajando con ellos, Ambati sentó las bases de lo que se convertiría en la base de código abierto de H2O. Pero no fue hasta que su madre contrajo cáncer de mama que se "inspiró para democratizar el aprendizaje automático para todos".

Ambati se propuso poner la IA al alcance de todos los médicos o científicos de datos que resolvieran problemas de valor para la sociedad, según sus propias palabras. Para ello, añadió, había que reinventar las matemáticas y la analítica a gran escala. Eso llevó a H2O, que reunió a ingenieros de compiladores, ingenieros de sistemas, matemáticos, científicos de datos y grandes maestros, para facilitar la construcción de modelos de alto valor y alta precisión, muy rápido.

Hay toda una línea de productos construida por H2O a lo largo de los años para materializar esto. Cuando H2O comenzó en 2012, dijo Ambati, había una brecha en los cimientos escalables de IA de código abierto. Había lenguajes como R y Python que permitían a la gente construir modelos, pero eran muy lentos o frágiles o no tenían todas las funciones. La contribución de H2O, según Ambati, fue que construyeron "la calculadora de distancia más rápida del mundo".

Esta es una referencia a las matemáticas básicas utilizadas para la multiplicación de matrices en el aprendizaje profundo. Cuando se puede calcular la distancia entre dos tensores largos, añadió Ambati, se puede empezar a producir matemáticas ricas, lineales y no lineales a través de datos de alta y baja dimensión.

Esa contribución es parte del marco de código abierto H2O. Ambati llama a esta base de bajo nivel "el lenguaje ensamblador para la IA". Luego, H2O integró marcos y comunidades de código abierto como Scikit-learn, XGBoost, TensorFlow de Google o PyTorch de Facebook. El equipo de H2O comenzó a contribuir a ellos, al tiempo que elaboraba un marco integrado en lo que se conocería como AutoML.

Los productos de H2O en ese espacio son H2O AutoML, basado en el código abierto H2O y XGBoost, y una oferta más amplia llamada Driverless AI, que es de código cerrado. Ambos se dirigen a datos de series temporales, que son la columna vertebral de muchos casos de uso empresarial, como la predicción de la pérdida de clientes, la prevención del fraude o la puntuación crediticia.

La antorcha de hidrógeno de H2O es la última incorporación a su cartera de productos, con el objetivo de llevar a la empresa un gran dominio de la IA para el procesamiento de imágenes, vídeo y lenguaje natural (NLP). Imagen: H2O

La IA sin conductor ha sido "el motor de la economía H2O", según Ambati, en los últimos cuatro años. Ayudó a H2O a adquirir cientos de clientes, contando con más de la mitad de las Fortune 500, incluyendo AT&T, Citi, Capital One, GlaxoSmithKline, Hitachi, Kaiser Permanente, Procter & Gamble, PayPal, PwC, Reckitt, Unilever y Walgreens.

Ambati llama a esta capa "los compiladores de la IA". Aquí es donde H2O comenzó a utilizar el enfoque de los grandes maestros: dividir el espacio del problema en muchas recetas, asignando grandes maestros de Kaggle a cada receta, con el objetivo de destilar su conocimiento para facilitar las cosas a los equipos en el terreno.

La siguiente fase después de crear un buen modelo de aprendizaje automático es operar este modelo de forma segura. Los datos tienen un sesgo inherente, y los modelos sesgados no deben pasar a producción sin ser cuestionados. Encontrar puntos ciegos y realizar pruebas adversarias y validación de modelos, implementar modelos y luego integrarlos en el CI/CD de la creación de software es lo que Ambati llama "el middleware para la IA".

Esto se aborda con una oferta de nube híbrida, local y periférica de H2O, la nube de IA. Los clientes lo utilizan a través de aplicaciones: hay una tienda de aplicaciones de IA, una tienda de modelos preconstruidos y tiendas de características, que cristalizan los conocimientos que surgen de la construcción del modelo. AI Cloud también es multinube, ya que los clientes quieren opciones. Luego también está H2O Wave, un SDK para crear aplicaciones, según Ambati.

De pie sobre los hombros de los gigantes de la web

Hydrogen Torch, la última incorporación a la cartera de H2O, está diseñada específicamente para aplicaciones de uso de procesamiento de imágenes, video y NLP, incluida la identificación o clasificación de objetos, el análisis de sentimientos o la búsqueda de información relevante en un texto. Es una oferta sin código, para lo cual Ambati dijo:

"Entra en el espacio tradicional de los gigantes de la web como Google, Microsoft, Amazon y Facebook, y utiliza parte de su innovación, pero los desafía al permitir a los clientes utilizar el aprendizaje profundo más fácilmente, tanto tomando modelos preconstruidos como transformándolos para uso local".

Ambati se refirió a algunos de los primeros casos de uso de Hydrogen Torch, como el procesamiento de vídeo en tiempo real. En Singapur, esto se hace para identificar si el tráfico ha aumentado o si ciertas situaciones pueden resultar en accidentes. El enfoque utilizado es tomar grandes modelos de aprendizaje automático "tradicionales" y luego ajustarlos a los datos específicos disponibles.

Hydrogen Torch utiliza PyTorch de Facebook y TensorFlow de Google bajo el capó. H2O los toma y añade la experiencia de los grandes maestros, además de un entorno integrado. Eso también incluye la oferta MLOps de H2O, que se alimenta de los datos y las tuberías de aprendizaje automático que van a producción.

Los modelos se monitorean continuamente para identificar si su precisión ha cambiado. Esto puede suceder porque el patrón de los datos entrantes ha cambiado o porque ha cambiado el comportamiento de los usuarios finales. De cualquier manera, el modelo se reconstruye y se vuelve a implementar.

Además, parte de la oferta sin código de Hydrogen Torch es la generación automatizada de documentación, de modo que los científicos de datos puedan profundizar para explorar qué datos se seleccionaron y qué transformaciones se aplicaron. Ambati afirmó que la precisión del modelo de la antorcha de hidrógeno puede ser hasta un 30% mejor en comparación con los modelos de referencia, alcanzando los percentiles superiores a 90.

Por supuesto, añadió, hay una conocida compensación en la IA entre la precisión, la velocidad y la explicabilidad. Dependiendo de los requisitos del caso de uso, se deben tomar decisiones. La velocidad, sin embargo, es un requisito universal.

En lo que respecta a la velocidad, el procesamiento en memoria de H2O desempeña un papel clave para garantizar que Hydrogen Torch pueda funcionar según sea necesario para los casos de uso de procesamiento de imágenes, videos y NLP. En un frente relacionado, H2O también tiene en su agenda la miniaturización de modelos de aprendizaje automático. Eso permitirá que los modelos se implementen en más dispositivos en el perímetro y también tengan un mejor rendimiento.

Hydrogen Torch también tiene sinergias con otro producto de la cartera de H2O, a saber, Document AI. Document AI permite procesar documentos entrantes, combinando métodos de imagen y NLP. Y luego están los datos de audio y video, de fuentes como las llamadas de Zoom y los podcasts, que están proliferando, y H2O tiene como objetivo ayudar a sus clientes a mantenerse al día.

H2O tiene colaboraciones continuas con clientes de alto perfil, como CommBank y AT&T. Los expertos de H2O y las organizaciones de los clientes crean conjuntamente modelos de aprendizaje automático, y existe un esquema de reparto de ingresos.

Ambati también identificó más áreas de crecimiento futuro en la cartera de H2O: la IA federada, la creación de contenidos, la generación de datos sintéticos, la narración de datos e incluso áreas como el periodismo de datos están en el radar de H2O. El objetivo, dijo Ambati, es generar confianza en la IA para servir a las comunidades. Se trata de una visión realmente grandiosa, para la cual el progreso es difícil de medir. Sin embargo, en lo que respecta a la hoja de ruta del producto, H2O parece estar en el camino correcto.

Artículos relacionados