Desde nuestro último post sobre la inteligencia artificial y la IA generativa, hemos asistido a una explosión de actividad que sólo puede calificarse de "hype-cycle". Hay un creciente apetito de los consumidores y las empresas por esta tecnología, y cada vez son más las compañías que se suben al carro. Y con todo este rumor, aumenta aún más el interés de los inversores, que buscan posicionarse por delante de cada nueva ola de desarrollo. También se impulsa una mayor regulación para proteger la propiedad intelectual y la privacidad.
Siempre que vemos un hype-cycle, nos preguntamos: ¿cómo hemos llegado a este punto y hacia dónde vamos?
La inteligencia artificial es el desarrollo de sistemas informáticos que realizan tareas que normalmente requieren inteligencia humana. Por ejemplo, percepción visual, reconocimiento del habla, toma de decisiones y traducción entre idiomas. Es una combinación de informática aplicada a conjuntos de datos para permitir la resolución de problemas. La IA generativa es un algoritmo capaz de crear nuevos contenidos, como audio, código, imágenes, texto, simulaciones y vídeo. La clave de la IA generativa es un extenso modelado del lenguaje que pueda analizar y aprender de interfaces de lenguaje natural, asociado con medios que puedan procurar entradas de lenguaje natural, con modelado e infraestructura de base de IA que puedan analizar entradas para crear salidas generativas.
La expresión se acuñó en diciembre de 1997, cuando dos informáticos, Sepp Hochreiter y Jurgen Schmidhuber, inventaron las redes de memoria a corto plazo de larga duración, que mejoran la capacidad de memoria de las redes neuronales y permiten reconocer patrones en los datos de entrenamiento. En 2012, Alex Krizhevsky nos dio AlexNet, una red neuronal convolucional entrenada en unidades de procesamiento gráfico, que batió el 75% de precisión en la identificación de imágenes a partir de una base de datos etiquetada manualmente. Mientras que Google ha liderado la investigación y el desarrollo en el campo durante más de una década, centrado en un producto llamado "BERT", OpenAI formó y lanzó su primer transformador generativo preentrenado en junio de 2018 llamado GPT, marcando el comienzo de una nueva era de LLM. Un año después, Microsoft invirtió mil millones de dólares en OpenAI, iniciando la carrera armamentística de la IA moderna, que culminó con un nuevo modelo de texto a imagen llamado Dall-E, y ChaptGPT, lanzado a finales de 2022, que se ha adoptado a velocidad de vértigo.
NVIDIA, Google, Microsoft, Meta e incluso las agencias gubernamentales lideran esta carrera armamentística y están enzarzadas en una batalla en la que cada una despliega miles de millones de dólares para ganar. Microsoft anunció una inversión de varios años y miles de millones de dólares en OpenAI y la integración exclusiva con su sistema Azure en enero de 2023. Stability.ai y Amazon se han asociado en AWS. Google anunció BARD e invirtió 300 millones de dólares en Anthropic.
PitchBook acaba de publicar su informe "Vertical Snapshot: Generative AI", en el que se examinan las tendencias del capital riesgo, la visión general del sector y el panorama del mercado en este ámbito. A continuación analizamos las subverticales, tecnologías y startups de IA que están obteniendo más financiación y por qué.
La interfaz de usuario en lenguaje natural (LUI o NLUI) es un tipo de interfaz humano-ordenador en la que el usuario y el sistema se comunican utilizando un lenguaje humano natural. Así, los usuarios se comunican con un ordenador utilizando su lenguaje hablado. La mayoría de nosotros lo utilizamos a diario en nuestros teléfonos u otros dispositivos (Siri, Alexa, etc.). Las mayores áreas de inversión dentro de este segmento específico fueron chatbots, voicebots y asistentes personales, que capturaron 544,9 millones de dólares en 2022 (59,6% de todos los dólares invertidos).
Los medios 2D son exactamente como suenan: cualquier obra de arte que salga en dos dimensiones, como pinturas, dibujos o impresiones. La IA puede utilizarse no sólo para crear medios 2D, sino también para convertirlos en medios 3D. En este ámbito, los inversores parecen ver más posibilidades en los avatares, la generación de vídeo y la edición, acaparando el 37,7% y el 40,8% del total de dólares invertidos, respectivamente.
AI Core y la biotecnología también aportaron cifras impresionantes. Según PitchBook, AI Core, que incluye desarrolladores de modelos fundacionales e infraestructura para el desarrollo de modelos, recaudó 5.000 millones de dólares entre 2018 y 2022. Las startups biotecnológicas que utilizan técnicas generativas también han despertado el interés de los inversores de capital riesgo, con 1.600 millones de dólares invertidos durante el mismo periodo.
Una conclusión fascinante del informe PItchBook es el crecimiento previsto de la IA generativa debido a las increíbles aplicaciones empresariales de esta tecnología. Las interfaces de lenguaje natural serán probablemente el principal catalizador de este crecimiento. De hecho, PitchBook "prevé que el mercado alcance los 98.100 millones de dólares en 2026, con una tasa de crecimiento interanual del 32,0%".
De cara al futuro, los costes de formación de los modelos de fundación están disminuyendo. El hardware personalizado y las herramientas de software aceleradas están abaratando la formación de nuevos LLM. Los puntos de precio son accesibles para las startups. Mientras tanto, los directores de información de las grandes corporaciones están impulsando la transformación digital y la adopción de IA en toda la empresa. Según un informe publicado por el MIT en septiembre de 2022, solo los departamentos de TI, cadena de suministro y finanzas estaban consiguiendo una adopción generalizada de la IA, y solo a un nivel del 40%. Creemos que el lanzamiento de ChatGPT4 está impulsando la adopción más profundamente en esas funciones e impulsando la expansión a ventas, marketing, desarrollo de productos y recursos humanos.
ChatGPT se ha vuelto viral, y los usuarios finales y los consumidores lo están adoptando. Mientras que las estimaciones de ayer sobre el tamaño del mercado y la oportunidad del software de IA parecían imposibles de alcanzar, ahora parecen infravaloradas.
Este espacio tiene un potencial fantástico y será interesante ver cómo acaba influyendo en todos los sectores y se convierte en una parte aún más importante de nuestra vida cotidiana. Un aspecto que será fundamental observar es cómo abordan los legisladores la regulación y qué tipo de implicaciones tendrán en esta tecnología en rápida evolución. Aunque, como ocurre con la mayoría de las tecnologías, la normativa tiene que ponerse al día con los avances.
¿Cuáles son los guardarraíles de la propiedad intelectual? ¿Quién es el propietario del contenido de salida si las entradas estaban protegidas por derechos de autor? ¿Quién es responsable de la infracción de los derechos de autor? ¿Y si el resultado es erróneo y da lugar a una conducta ilícita? ¿Quién asumirá el riesgo de la responsabilidad? ¿Estará asegurada? ¿Cómo puede proteger su imagen, semejanza, discurso e imágenes, y cómo puede hacerlos valer?
Es un mundo nuevo y valiente; es posible que nos encontremos en los primeros compases de una nueva revolución tecnológica. Para las nuevas empresas que buscan financiación, creemos que las claves del éxito residirán en la tecnología fundacional combinada con algoritmos únicos que hayan demostrado su utilidad y tracción en al menos un sector vertical, pero con aplicaciones en todos los sectores verticales. Aunque es posible que la crisis bancaria haya interrumpido los flujos de financiación durante un periodo limitado, el ciclo de la IA generativa ha cobrado impulso y tiene capacidad de permanencia.