La empresa estadounidense OpenAI, creadora de la plataforma ChatGPT, tendrá un equipo dedicado a identificar y prevenir riesgos asociados a la Inteligencia Artificial (IA) en sus modelos en desarrollo.
Algunas categorías que serán investigadas incluyen ciberseguridad, poder de persuasión y potencial autonomía. Un grupo, cuyas directrices fueron divulgadas este lunes, será el encargado de esta tarea. Este análisis puede acarrear la suspensión de nuevos lanzamientos de aplicaciones, según la empresa.
OpenAI realiza el anuncio un mes después de que su consejo directivo despidiera al director ejecutivo Sam Altman, pero acabara volviendo a contratarle pocos días después, tras una masiva y dura protesta de los empleados e inversores.
Lea también:
- Google lanza Gemini, nueva herramienta de inteligencia artificial que compite con ChatGPT
- La Inteligencia Artificial en pro de mejorar el ámbito laboral
De acuerdo con varios medios estadounidenses, los miembros del Consejo de administración criticaban a Altman por privilegiar el desarrollo acelerado de OpenAI, aunque esto implicara eludir ciertas interrogantes sobre los posibles riesgos de la IA.
«Modelos de frontera»
«Creemos que el estudio científico de riesgos catastróficos derivados de la AI no ha estado a la altura que debería estar», afirmó la empresa en un «marco de trabajo» disponible en su página web.
El trabajo de este equipo, bajo las nuevas directrices, debería «ayudar a cubrir ese vacío», añadió OpenAI.
El grupo se concentrará en los llamados «modelos de frontera» que la empresa desarrolla, con capacidades superiores a los software actuales de IA.
Sólo podrán desplegarse aquellos modelos catalogados de riesgo «medio» o inferior, tras un análisis en cuatro categorías, según el documento.
La primera de ellas es la ciberseguridad y la capacidad del modelo de llevar adelante ciberataques a gran escala. En segundo lugar, analizarán la propensión del programa a crear preparaciones químicas, organismos (como un virus) o armas nucleares, todos los que potencialmente pueden generar daños para los humanos.
La tercera categoría se concentra en los poderes de persuasión del modelo: hasta qué punto es capaz de influenciar la conducta de una persona. Por último, evaluarán el riesgo de su potencial autonomía, especialmente si el software es capaz de salirse del control de los programadores que lo
crearon.
El Grupo de Asesoramiento en Seguridad de OpenAI recibirá toda la información recolectada, incluidos los riesgos identificados. Se trata de un nuevo equipo que hará recomendaciones a Altman o alguien nombrado por él.
Además, Altman decidirá entonces sobre posibles modificaciones necesarias para reducir los riesgos del modelo.
El Consejo de administración será informado y podrá revertir las decisiones de la dirección.