Open AI describe cómo utilizar GPT-4 para moderar contenidos.
OpenAI afirma que ha desarrollado una forma de utilizar ChatGPT para moderar contenidos. La técnica consiste en proporcionar a GPT-4 una política que guía al modelo en la toma de decisiones de moderación y en la creación de un conjunto de pruebas con ejemplos de contenidos que podrían infringir o no la política. Una política podría prohibir, por ejemplo, dar instrucciones o consejos para adquirir un arma o robar un coche.
«Al examinar las discrepancias entre los juicios de GPT-4 y los de un ser humano, los expertos en políticas pueden pedir a GPT-4 que explique el razonamiento que hay detrás de sus etiquetas, analice la ambigüedad en las definiciones de las políticas, resuelva la confusión y proporcione más aclaraciones sobre la política en consecuencia», escribe OpenAI en la publicación. «Podemos repetir [estos pasos] hasta que estemos satisfechos con la calidad de la política».
OpenAI afirma que su proceso puede reducir el tiempo necesario para implementar nuevas políticas de moderación de contenidos de meses a horas.
«Los juicios de los modelos lingüísticos son vulnerables a sesgos indeseados que podrían haberse introducido en el modelo durante el entrenamiento», escribe la empresa en la publicación. «Al igual que con cualquier aplicación de IA, los resultados y los productos deberán supervisarse, validarse y perfeccionarse cuidadosamente manteniendo a los seres humanos en el circuito».
La entrada del blog incluye un útil vídeo que explica cómo funciona el proceso.
La moderación de contenidos desempeña un papel crucial en el mantenimiento de la salud de las plataformas digitales. Un sistema de moderación de contenidos que utiliza GPT-4 permite una iteración mucho más rápida de los cambios en las políticas, reduciendo el ciclo de meses a horas. GPT-4 también es capaz de interpretar las reglas y los matices de la extensa documentación sobre políticas de contenido y adaptarse instantáneamente a las actualizaciones de las políticas, lo que se traduce en un etiquetado más coherente.
Ver artículo de referencia